


康永 尚 沈 金松 庶 卓 恒 编著 





五 汕 王 证 侧 版 社 


ISBN _7—5021-5097-8 / TE - 3944( 课 ) 
91787502!150976l> — Ef: e 











高 等 学 校 教 材 


现代 数学 地 质 


康永 尚 ” 沈 金松 诺 卓 恒 编著 


石油 工业 出 版 社 





内 容 提 要 


本 教材 是 针对 油气 勘探 开发 人 才 的 培养 而 设计 的 ,内 容 覆 盖 面 广 ,从 概率 论 和 数理 统计 的 
基础 知识 到 其 应 用 ,从 单 变量 分 析 到 多 变量 分 析 , 从 空间 无 关 的 变量 到 空间 相关 的 变量 , 从 线 
性 科学 的 思维 观 到 非 线性 科学 的 思维 观 ,从 易 到 难 渐次 深入 ,构成 一 个 油气 地 质 和 开发 领域 从 


基础 到 应 用 的 数学 地 质 方法 体系 。 


本 书 可 作为 高 等 院 校 地 质 勘探 .地质 工 程 及 环境 工程 相关 专业 本 科 生 和 研究 生 的 专业 基 
础 课 教材 ,也 可 供 石油 地 质 等 专业 的 生产 和 科研 单位 相关 人 员 和 参考 。 
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地 质 学 最 重要 的 应 用 是 各 种 自然 资源 的 开发 和 利用 , 随 着 社会 的 发 展 , 越 来 越 多 的 数据 资 
料 不 断 积累 ,从 这 些 数 据 中 挖掘 规律 和 知识 ,对 于 更 好 地 开发 和 利用 各 种 自然 资源 具有 重要 的 
意义 。 欧 洲 经 济 共同 体 一 位 负责 人 曾经 说 过 一 句 非 常 深刻 的 话 :“ 欧 洲 的 许多 矿产 资源 存在 于 
数据 库 中 ” ,我 们 可 以 这 样 理解 :通过 矿产 数据 的 分 析 , 揭 示 在 数据 中 存在 的 信息 ,可 以 对 矿产 
赋 存 特点 有 进一步 的 认识 ,进而 帮助 我 们 找到 更 多 的 资源 。 

无 论 是 作为 勘探 地 质 工作 者 ,还 是 作为 油气 藏 工程 师 ,都 越 来 越 强调 对 地 质 现象 或 地 质 体 
定量 研究 的 能 力 ,尤其 是 随 着 资料 的 不 断 积累 ,这 种 趋势 在 不 断 加 强 。 

利用 数据 资料 形成 认识 的 过 程 是 一 个 分 析 和 归纳 的 过 程 ,而 利用 这 种 认识 指导 实践 的 过 
程 是 一 个 推断 过 程 ,前 者 是 途径 ,后 者 是 目的 ,认识 世界 最 终 是 为 了 改造 世界 。 

定量 分 析 的 基础 是 数据 ,分 析 过 程 是 建 模 过 程 , 建 模 有 确定 型 和 随机 型 两 种 模式 。 确 定型 
模式 探求 的 是 某 一 变量 与 其 影响 因素 之 间 的 函数 关系 ,这 当然 是 科学 研究 应 当 追 求 的 最 终 模 
式 ,因为 ,函数 关系 具有 逻辑 和 形式 上 的 美学 意义 , 它 带 来 的 是 精确 的 预测 ,是 人 们 对 研究 变量 
百分之百 的 掌控 。 然 而 ,自然 现象 不 同 于 人 类 可 以 操控 的 室内 物理 实验 ,任何 一 个 自然 变量 都 
是 在 "上 帝 "操控 下 的 实验 结果 ,尤其 是 地 质变 量 , 不 仅 有 "无 数 只 手 "在 影响 它 , 改 变 它 , 而 且 ， 
这 种 影响 和 改变 历经 漫长 岁月 ,使 得 变量 与 其 影响 因素 之 间 的 关系 变 得 极其 复杂 ,以 至 于 建立 
函数 关系 的 企图 遭遇 严峻 的 挑战 。 

然而 ,复杂 中 孕育 着 简单 ,大 量 的 数据 表现 出 规律 ,也 正 是 如 此 ,统计 学 这 一 基本 的 工具 在 
地 质 现象 的 研究 中 得 到 了 广泛 的 应 用 。 显 然 ,用 统计 学 这 一 工具 研究 地 质 现象 ,体现 的 正 是 人 
类 的 智慧 和 不 屈 不 挠 的 科学 精神 ,数学 地 质 也 正 是 在 这 一 基础 上 不 断 发 展 成 为 一 个 庞大 的 知 
识 系统 。 

现代 数学 地 质 涉及 地 质 学 的 诸多 领域 ,对 于 油气 地 质 工 作者 来 说 ,究竟 需要 掌握 哪些 内 
容 ,也 就 是 说 ,一 本 适合 的 石油 高 等 院 校 教材 应 包括 哪些 主要 内 容 ? 这 是 我 们 长 期 思考 的 一 个 
问题 。 在 中 国 石油 大 学 的 教学 工作 为 我 们 提供 了 一 条 探索 这 一 问题 的 有 效 途径 。 

我 们 从 1994 年 开始 ,先后 在 中 国 石油 大 学 (北京 ) 和 中 国 石油 大 学 (华东 ) 主 讲 了 研究 生 
(包括 进修 生 ) 和 博士 生 课程 《地质 统计 学 》《 分 形 几何 》《 数 学 地 质 》 和 《现代 数学 地 质 》, 累 计 
20 次 之 多 ,对 研究 生 层 次 的 数学 地 质 培养 进行 了 有 益 的 探索 ,在 空间 相关 统计 学 和 分 形 几何 
方面 ,进行 了 理论 方法 和 应 用 实例 方面 的 总 结 ,同时 ,相关 方面 的 科研 工作 也 起 到 了 一 定 的 推 
动作 用 ,使 这 部 分 内 容 逐 步 得 到 了 充实 和 完善 。 

本 科 生 数学 地 质 的 教学 实践 使 我 们 回 过 头 来 ,考虑 更 加 基础 的 内 容 一 一 概率 论 、 数 理 统 
计 、 线 性 回归 和 多 元 统计 分 析 。 教 材 在 体现 这 些 内 容 时 试图 从 简单 的 实例 出 发 引出 定理 和 公 
式 。 

希望 这 本 教材 能 引导 更 多 的 读者 对 数学 地 质 产生 兴趣 并 在 今后 的 工作 中 自 党 地 应 用 数学 
地 质 方法 ,促进 研究 工作 向 半 定 量化 和 定量 化 方向 发 展 ,为 油气 勘探 开发 事业 做 出 更 大 的 贡 
献 。 

教材 的 编写 和 顺利 出 版 是 多 方面 持续 支持 和 努力 的 结果 ,我们 首先 要 感谢 中 国 石油 大 学 





(北京 ) 资 源 与 信息 学 院 书记 庞 雄 奇 教授 、 院 长 朱 筱 敏 教授 和 副 院 长 陈 小 宏 教授 和 钟 守 宁 教 授 
对 该 教材 出 版 的 大 力 支 持 。 我 们 感谢 资源 与 环境 系 和 盆地 与 油 藏 研究 中 心 的 领导 与 同事 们 对 
我 们 教学 工作 的 支持 和 帮助 。 同 时 ,我 们 要 特别 感谢 彭 仕 密教 授 对 教材 编写 工作 的 支持 和 和 尹 
志 军 博士 对 教材 编写 的 贡献 。 

中 国 石油 大 学 张 一 伟 教授 和 能 琦 华 教授 长 期 致力 于 统计 学 方法 在 油 藏 定量 描述 中 的 应 
用 ,有 力 地 推动 了 现代 数学 地 质 在 石油 大 学 的 教学 和 科研 应 用 工作 ,本 教材 也 凝聚 着 前 辈 的 心 
血 , 在 此 ,对 他 们 的 杰出 工作 表示 崇高 的 敬意 。 这 里 还 要 提 及 的 是 金 之 钧 教授 首先 提出 在 中 国 
石油 大 学 (北京 ) 为 研究 生 开设 数学 地 质 课程 的 计划 并 编写 了 教学 大 网, 虽然 因 其 有 其 它 更 重 
要 的 工作 而 未 讲授 该 课程 ,但 他 的 努力 为 我 们 后 来 开设 数学 地 质 课程 莫 定 了 基础 ,也 为 本 教材 
的 形成 提供 了 教学 实践 契机 ,在 此 表示 感谢 。 

本 教材 前 言 绪论 .第 一 章 、 第 二 章 的 第 一 节 到 第 四 节 中 的 参数 估计 部 分 以 及 第 五 章 到 第 
七 章 由 康永 尚 编写 ,其 中 ,第 七 章 中 随机 模拟 应 用 实例 由 尹 志 军 博士 提供 ;第 八 章 以 康永 尚 纺 
写 为 主 , 沈 金 松 补充 了 部 分 应 用 实例 ;第 二 章 第 四 节 中 的 假设 检验 部 分 以 及 第 三 章 到 第 四 章 由 
沈 金松 编写 ,在 第 四 章 编写 过 程 中 吸收 了 旅居 加 拿 大 的 诺 卓 恒 博士 提供 的 素材 和 应 用 实例 ;全 
书 由 康永 尚 统 稿 。 研 究 生 杨帆 徐 显 生 和 徐 桂 华 等 协助 完成 了 教材 中 部 分 图 件 的 清 绘 和 数据 
表 的 制作 及 其 它 事 务 性 工作 ,对 他 们 的 工作 表示 感谢 。 

中 国 石油 大 学 (北京 ) 陈 安乐 教授 对 全 书 进行 了 详细 的 审 校 ,提出 了 大 量 宝贵 意见 ,在 此 ， 
编著 者 训 心 感谢 陈 老师 的 辛勤 劳动 。 

本 教材 是 编著 者 长 期 教学 实践 的 总 结 和 凝练 ,编著 者 的 家 庭 给 予 的 支持 是 完成 这 一 工作 
最 有 力 的 保证 ,在 此 表示 感谢 。 

尽管 几经 修改 ,但 教材 中 的 错误 在 所 难免 ,欢迎 并 感谢 读者 能 给 予 指正 并 与 我 们 取得 联 
系 ,以 便 该 教材 体系 能 在 未 来 的 实践 中 不 断 完善 。 我 们 的 联系 方式 是 :kangysh © sina. com, jin- 
songshen © hotmail . com, zchen © shaw. cao 
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绪 论 


《现代 数学 地 质 ) 学 习 目 的 和 要 求 :能 够 把 概率 论 和 数理 统计 知识 熟练 地 应 用 到 
油气 勘探 开发 的 决策 分 析 和 地 质变 量变 化 规律 的 研究 和 预测 中 ,掌握 多 元 统计 学 的 
基本 原理 及 其 应 用 ,深刻 理解 空间 相关 统计 学 的 精 精 并 能 应 用 于 空间 变量 的 定量 化 
研究 中 ,了 解 非 线性 科学 的 新 思维 和 分 形 几何 的 基本 原理 及 其 应 用 。 


一 、 数 学 地 质 的 起 源 与 发 展 


1. 数 学 地 质 的 定义 

关于 数学 地 质 的 定义 ,尚未 有 一 致 的 说 法 ,Davis(1973) 把 数学 地 质 定义 为 "地质 数据 的 定量 
分 析 方法 ”, 而 Agterberg(1974) 把 数学 地 质 定义 为 “地 球 科学 中 的 全 部 数学 应 用 ”, 赵 鹏 大 (1983) 认 
为 “数学 地 质 是 研究 最 优 数学 模型 并 查 明 地 质 运动 数量 规律 性 的 科学 ”"。 无 论 采 用 何 种 定义 ,我 
们 都 可 以 把 数学 地 质 理解 为 以 数学 作为 基本 的 理论 和 方法 ,以 计算 机 作为 工具 ,对 地 质 现象 进行 
定量 化 研究 的 一 门 边 缘 学 科 , 是 由 地 质 学 数学 和 计算 机 科学 互相 结合 而 逐渐 发 展 完善 的 。 

2. 数 学 地 质 产 生 的 原因 及 对 地 球 科学 的 影响 

传统 的 地 质 学 基本 上 是 一 门 描 述 性 的 学 科 , 从 事 地 质 学 研究 的 人 对 数学 在 地 质 学 研究 中 
的 应 用 及 所 起 的 作用 还 存在 不 同 的 看 法 。 然 而 , 随 着 人 类 对 地 球 研究 和 探索 的 深入 ,需要 研究 
多 种 地 质 因素 对 某 一 地 质 现象 的 影响 ,分 析 多 种 地 质 因素 间 的 相互 关系 及 各 自 的 相对 重要 性 ， 
对 于 这 样 的 一 系列 复杂 问题 没有 数学 作为 工具 是 不 行 的 。 其 次 , 随 着 研究 手段 的 多 样 化 ,通过 
实验 和 观察 获得 了 大 量 的 数据 ,要 利用 这 些 数据 研究 各 种 量 之 间 的 关系 及 各 种 量 的 变化 等 反 
映 地 质 运动 和 变化 的 规律 ,必须 应 用 数学 方法 和 计算 工具 。 再 次 ,数学 是 研究 和 模拟 各 种 地 质 
现象 的 理论 基础 ,大 气 运动 规律 .地 碗 变化 和 运动 的 研究 等 都 需要 数学 模拟 。 

随 着 数学 向 传统 地 质 学 的 渗透 和 应 用 ,地 质 学 研究 逐渐 由 定性 向 定量 分 析 过 渡 , 也 由 最 初 
的 单 变量 分 析 向 多 变量 分 析 过 渡 。 所 研究 的 对 象 也 由 确定 性 事件 向 随机 性 事件 过 渡 , 对 地 质 
事件 和 地 质 现象 的 分 析 也 由 定性 解释 向 定量 分 析 与 数值 模拟 相 结合 的 阶段 发 展 。 

3. 数 学 地 质 发 展 的 4 个 阶段 

数学 被 逐步 引入 到 地 质 学 中 经 历 了 160 多 年 的 历史 ,作为 一 门 新 兴 的 边缘 学 科 , 数 学 地 质 
已 有 60 多 年 的 发 展 历史 。 从 应 用 的 广泛 性 看 ,数学 地 质 的 发 展 大 致 经 历 了 以 下 4 个 阶段 。 

IT) 孕育 阶段 (1950 年 以 前 ) 

1840 年 英国 地 质 学 家 Lyell 首次 以 古生物 化 石 的 统计 分 析 为 论据 ,对 第 三 纪 地 层 进行 了 划 
分 ,确定 了 岩石 地 层次 序 ,著述 了 《定量 动物 学 ) 一 书 ,开创 了 数学 方法 引入 地 质 学 问题 研究 的 
先例 。 上 世纪 30 年 代 后 期 ,Simpson( 1939) 著述 的 《分 析 地 质 学 ) 一 书 中 列举 了 统计 学 在 生物 
研究 中 的 多 方面 应 用 。Burma(1949) 在 “多 元 分 析 一 一 地 质 学 和 古生物 学 中 的 一 种 模型 分 析 工 
具 " 一 文中 明确 提出 了 多 元 统计 方法 是 一 种 最 有 前 景 的 生物 计量 方法 。Krumbein 和 格 里 菲 斯 
在 沉积 学 研究 中 也 使 用 了 概率 统计 方法 ,为 用 数学 方法 研究 地 质 现象 和 个 别 指标 的 统计 分 析 
解决 具体 地 质问 题 英 定 了 基础 。 这 一 阶段 也 是 统计 分 析 在 地 质 学 中 应 用 的 可 能 性 问题 讨论 最 
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为 激烈 的 时 期 。 

2) 早 期 阶段 (1951 ~ 1960) 

Krumbein(1956) 在 研究 岩石 的 矿物 成 分 . 岩 性 和 化 学 成 分 时 ,应 用 了 多 元 统计 方法 ,并 把 岩 
石 成 分 作为 n 维 空间 中 的 一 个 点 或 向 量 进行 统计 处 理 。 尤 其 值得 指出 的 是 ,1958 年 由 Krum- 
bein 和 斯 洛斯 公开 发 表 了 第 一 个 面向 地 质 应 用 的 计算 机 程序 ,标志 着 计算 机 技术 在 地 质 研究 
中 应 用 的 开端 ,加 速 了 地 质 学 的 定量 化 研究 进程 。1958 年 Sichel 和 Kridge 编著 的 《地 质 统计 
学 》 及 Allais(1957) 发 表 的 《单元 中 矿床 数 服从 泊 松 分 布 的 矿产 资源 定量 评价 》 等 重要 文献 奠定 
了 地 质 统计 学 分 支 学 科 的 基础 ,是 数学 地 质 早期 发 展 的 重要 阶段 。 

3) 形 成 发 展 阶段 (1961 ~ 1980) 

自 1968 年 在 布拉格 第 23 届 国 际 地 质 大 会 上 成 立国 际 数学 地 质 协 会 (IAMG) 并 由 维 斯 捷 列 
马 斯 任 第 一 届 国 际 数学 地 质 协会 主席 以 来 ,数学 地 质 这 一 边缘 交叉 学 科 得 到 了 长 足 的 发 展 。 
1969 年 出 版 了 两 种 专门 的 数学 地 质 刊 物 一 一 《Mathematical Geology》 和 《Computers & Geoscienc- 
es) ,后 来 又 设立 了 新 刊物 (Nonnewreable Resources)。 随 着 人 类 对 资源 需求 的 增加 ,社会 对 资源 
评价 和 预测 研究 精度 的 要 求 也 逐渐 提高 ,迫使 地 质 学 家 和 工程 技术 人 员 寻 求 更 加 可 靠 和 精确 
的 评价 和 预测 模型 。 例 如 ,在 石油 禁 运 和 社会 对 油气 需求 增 大 的 背景 下 , Harris( 1973) RRT 
多 元 统计 评价 及 主观 概率 评价 两 种 油气 资源 评价 模型 。 为 了 加 强 矿 产 资源 的 定量 评价 ,Agter- 
berg(1974) 针 对 法 国 和 非洲 的 一 些 固体 矿床 的 储量 和 品位 的 评价 ,提出 了 矿产 资源 评价 的 逻辑 
模型 。 

4) 深 入 广泛 的 发 展 阶段 (1980 年 至 今 ) 

这 一 阶段 中 ,数学 地 质 向 更 广泛 和 更 高 水 平 发 展 。 随 着 超大 规模 集成 电路 的 计算 机 的 研 
制 成 功 和 各 种 新 的 应 用 数学 模型 的 建立 ,促进 了 数学 地 质 向 更 加 深入 和 稳健 的 方向 发 展 。 如 
日 本 林 知已 夫 的 数量 化 理论 ,美国 麦克 卡门 和 波 特 波 尔 的 特征 分 析 和 前 苏联 的 康 土 坦 丁 诺 夫 
的 逻辑 信息 方法 等 为 定性 地 质变 量 和 定量 地 质变 量 的 联合 数学 模型 的 建立 提供 了 基础 。 地 质 
过 程 的 计算 机 模拟 地质 数据 库 的 建立 和 地 学 领域 内 人 工 智能 专家 系统 的 研制 和 应 用 ,为 数学 
地 质 的 广泛 应 用 提供 了 更 加 先进 和 方便 的 手段 。 

由 于 计算 机 和 计算 数学 的 发 展 ,新 的 多 元 统计 分 析 方法 和 新 的 数学 理论 和 方法 不 断 与 地 
质 结合 ,使 数学 地 质 更 加 完善 和 成 熟 。 人 们 开始 研究 一 些 新 的 数学 地 质 方法 ,如 法 国 著名 的 数 
学 家 Tom(1968) 提 出 了 用 数学 工具 描述 灾难 性 或 突如其来 的 变化 现象 的 突变 理论 ,后 来 又 将 
微分 拓扑 学 的 研究 成 果 应 用 于 地 质 学 ,建立 了 地 质 学 中 的 突变 理论 模型 ,用 于 研究 断层 运动 、 
二 又 纪 海洋 无 消 椎 动物 的 灭绝 原因 等 。 

人 工 智能 及 专家 系统 的 研究 使 专家 的 知识 和 经 验 能 为 他 人 所 用 ,充分 发 挥 了 计算 机 和 专 
家 的 作用 ; 自 美国 斯 坦 福 国 际 人 工 智能 研究 所 于 1976 年 研制 成 功 地 学 领域 内 的 第 一 个 专家 系 
统一 一 Prospector 以 来 ,利用 该 系统 美国 的 一 家 勘探 公司 已 在 华盛顿 州 发 现 了 一 个 钼 矿床 。 美 
国 的 石油 资源 评价 专家 系统 及 斯 仑 贝 谢 跨国 测 井 公司 研制 的 地 层 倾角 测 井 资料 处 理解 释 咨询 
系统 (Dipmeter Advisor) 已 在 油气 勘探 和 开发 中 取得 了 很 好 的 效果 。 地 质数 据 库 的 成 功 应 用 为 
资料 的 交流 和 综合 应 用 提供 了 可 能 。 


二 ,数学 地 质 的 最 新 进展 


从 近年 数学 地 质 发 展 的 趋势 看 ,数学 地 质 正 全 方位 地 向 各 地 质 分 支 学 科 渗 透 ,数学 地 质 与 
新 发 展 的 其 它 学 科 交 叉 的 深度 和 广度 在 不 断 扩 大 ,较为 突出 的 表现 为 以 下 几 个 方面 : 
«2. 





(1) 非 线性 科学 在 地 质 学 中 的 应 用 。 

自 变量 的 连续 改变 而 发 生 不 连续 变化 的 数学 理论 一 一 突变 理论 的 发 展 。 突 变现 象 的 共同 
特点 是 ,条 件 微 变 会 导致 系统 宏观 状态 的 剧变 。 例 如 ,地 质 学 中 的 突变 理论 模型 ,用 于 研究 断 
层 运动 二 看 纪 海洋 无 峭 椎 动物 的 灭绝 原因 等 方面 取得 了 可 喜 的 进展 。 

(2) 人 工 智能 在 地 质 学 中 的 应 用 :专家 系统 在 地 质 学 中 的 应 用 ;多 种 人 工 智能 技术 在 地 质 
学 中 的 综合 应 用 ,如 神经 网 络 .遗传 算法 等 。 

(3) 地 理 信息 系统 :在 计算 机 软件 的 支持 下 ,空间 数据 输入 \ 存 储 、 检 索 、 运 算 、 显 示 和 综合 
分 析 的 应 用 技术 系统 在 地 学 领域 中 的 应 用 。 

(4) 数 据 库 技术 在 地 质 学 中 的 应 用 。 

(5) 自 动 绘图 技术 在 地 质 学 中 的 应 用 。 

(6) 计 算 机 的 最 新 硬 软件 在 地 质 学 中 的 应 用 。 

从 数学 地 质 的 最 新 进展 来 看 ， 非 线性 科学 "认识 论 在 理论 分 析 方 面 的 开拓 和 已 成 熟 方法 
的 软件 化 ,代表 两 个 主流 。 


三 、 现 代数 学 地 质 包含 的 主要 内 容 


根据 以 上 对 数学 地 质 定义 的 理解 ,我 们 可 以 说 数学 地 质 是 一 门 迅 速 发 展开 放 的 学 科 。 随 
着 计算 机 技术 的 不 断 提高 和 地 球 科学 的 发 展 ,计算 机 应 用 的 日 益 普及 ,地 质 现象 的 定量 化 研究 
已 成 为 一 个 必然 趋势 ,数学 地 质 要 解决 的 问题 正 是 地 质 现象 的 定量 化 这 一 极为 困难 的 问题 。 
作为 一 门 把 地 质问 题 定量 化 不 断 推 向 深度 和 广度 的 ,具有 生命 力 的 综合 性 边缘 学 科 , 正 莲 勃发 
展 着 , 它 以 多 种 数学 方法 为 基础 ,同时 吸收 了 现代 物理 学 化 学 、 社 会 科学 等 研究 成 果 ,借助 于 
计算 机 ,实现 对 地 质 过 程 的 模拟 、 对 地 质 现象 时 空 变化 的 分 析 、 对 多 种 变量 之 间 相互 关系 的 刻 
画 , 而 以 各 种 预测 为 最 终 目标 ,为 人 类 的 生产 实践 提供 决策 的 量化 依据 。《 现 代数 学 地 质 》 包 括 
以 下 主要 内 容 : 

(1) 数 据 分 布 类 型 及 预 处 理 :地 质数 据 的 分 布 类 型 及 其 检验 数据 的 特征 分 析 , 变 量 的 选择 
及 最 佳 组 合 ,地 质数 据 之 预 处 理 ; 

(2) 属 性 分 析 与 综合 :相关 、 育 类、 判别、 对 应 、 因 子 分 析 等 ; 

(3) 地 质 多 元 统计 分 析 方 法 :趋势 面 分 析 ,特征 的 空间 分 布 单位 向 量 场 分 析 ; 

(4) 矿 产 资源 统计 预测 : Delphi X EMER REED 、 条 件 概率 等 ; 

(5) 时 间 序 列 分 析 预 测 ; 

(6) 地 质 统计 学 ; 

(7) 模 糊 数学 和 突变 论 ; 

(8) 分 形 理论 ; 

(9) 灰 色 系统 ; 

(10) 地 质 过 程 的 计算 机 模拟 (如 盆地 模拟 ); 

(11) 地 质数 据 库 及 地 质数 据 处 理 系统 (如 GIS); 

(12) 信 工 智能 专家 系统 。 

现代 数学 地 质 是 一 个 庞大 的 知识 体系 ,根据 我 们 的 教学 经 验 ,针对 油气 勘探 开发 地 质 和 工 
程 人 才 培 养 的 需要 ,试图 建立 起 从 数理 统计 基础 到 专业 应 用 的 一 个 实用 且 相对 完整 的 知识 结 
构 体系 并 努力 使 本 教材 具有 如 下 特色 : 

(1) 针 对 性 :主要 针对 石油 勘探 开发 的 需求 设计 教材 的 内 容 。 





(2) 新 颖 性 :涉及 风险 分 析 、 空 间 相关 统计 学 、 非 线性 科学 思维 观 和 分 形 几何 等 方法 ,有 些 
方法 在 国内 目前 应 用 还 比较 少 ,但 随 着 我 国 社会 经 济 的 发 展 ` 资 料 数据 的 积累 尤其 是 油 公司 体 
制 的 逐步 确立 ,其 应 用 前 景 良好 。 

(3) 系 统 性 :从 概率 论 基础 开始 ,逐步 深入 ,过 渡 到 空间 相关 统计 学 比较 前 沿 的 领域 ,最 后 ， 
引入 非 线性 科学 的 思维 观 和 方法 论 。 

(4) 学 科 交 叉 性 : 软 硬 学 科 交 叉 (决策 科学 和 地 质变 量 定量 表征 ) 勘探 和 开发 的 学 科 交 又。 

(5) 实 用 性 :每 部 分 方法 原理 之 后 , 附 有 在 勘探 开发 领域 内 的 应 用 实例 。 

(6) 应 用 的 广泛 性 :适用 于 “地 质 工程 ”“ 矿 产 普查 与 勘探 "“ 地 球 探测 与 信息 技术 "" 油 
气井 工程 "“ 油 气田 开发 工程 "和 “环境 科学 "等 多 个 二 级 学 科 。 

根据 以 上 思路 本 教材 设计 了 8 章 内 容 , 从 概率 论 和 数理 统计 的 基础 知识 到 其 应 用 ,从 单 变 
时 到 多 变量 ,从 空间 无 关 的 变量 到 空间 相关 的 变量 ,从 线性 科学 的 思维 观 到 非 线性 科学 的 思维 
观 , 从 易 到 难 渐 次 深入 :第 一 、 第 二 章 作为 概率 论 和 数理 统计 的 基础 知识 ,从 基本 概念 、 基 本 公 
式 、 基 本 方法 和 在 油气 勘探 开发 中 的 应 用 几 个 方面 进行 了 介绍 和 讨论 ;第 三 章 为 线性 相关 和 线 
性 回归 ,其 重点 是 阐明 最 小 二 乘法 的 基本 原理 及 简单 和 多 元 线性 回归 方程 的 建立 与 应 用 ;第 四 
章 为 多 元 统计 学 ,主要 介绍 了 趋势 面 分析 、 主 成 分 分 析 、 聚 类 分 析 和 判别 分 析 等 多 变量 研究 中 
常用 的 方法 ;第 五 章 到 第 七 章 为 空间 相关 地 质变 量 研究 一 一 地 质 统计 学 的 主要 内 容 , 从 区 域 化 
变量 的 结构 分 析 、 普 通 克 立 金 、 指 示 克 立 金 和 地 质变 量 的 随机 模拟 及 其 应 用 等 方面 进行 了 分 析 
讨论 ;第 八 章 涉及 非 线性 科学 的 基本 思维 观 和 分 形 几何 的 基本 原理 及 其 应 用 。 





第 一 章 ”概率 论 基 础 及 其 在 油气 勘探 开发 
决策 中 的 应 用 


本 章 学 习 目 的 和 要 求 :简要 回顾 概率 论 基本 知识 ,介绍 概率 论 在 油气 勤 探 风险 决 
策 分 析 中 的 应 用 ,为 以 后 各 章 的 学 习 英 定 基础 ,并 使 学 生 能 熟练 地 把 概率 论 的 基本 方 
法 应 用 到 油气 勘探 开发 的 决策 分 析 中 。 


第 一 节 ”概率 论 基础 


一 、 基 本 概念 


在 自然 界 和 人 类 社会 中 存在 着 两 类 不 同 的 现象 ,一 类 是 确定 性 现象 , 另 一 类 是 随机 性 现 
象 。 

1. 确 定性 现象 和 随机 性 现象 

在 一 定 条 件 S 下 进行 某 种 试验 或 观察 ,事先 可 以 预料 必然 出 现 某 种 结果 ,或 者 说 在 条 件 5 
不 变 的 情况 下 ,重复 进行 一 系列 这 种 试验 或 观察 ,所 得 结果 是 完全 相同 的 。 像 这 类 在 一 定 条 件 
下 必然 出 现 某 种 结果 的 现象 称 为 确 法 性 现象 ,如 纯 水 在 一 个 大 气压 下 加 热 到 100C 时 必然 沸 
腾 , 异 性 电荷 必然 互相 吸引 、 同 性 电荷 必然 互相 排斥 等 缘 为 确定 性 现象 。 

在 一 定 条 件 S 下 进行 某 种 试验 或 观察 ,在 试验 或 观察 之 前 无 法 预知 确切 的 结果 ,只 知道 
可 能 出 现 这 样 的 结果 ,也 可 能 出 现 那样 的 结果 。 当 然 ,一 旦 试验 或 观察 进行 之 后 ,出 现 什么 结 
果 就 是 完全 确定 的 了 。 但 是 ,在 试验 条 件 5 不 变 的 情况 下 ,重复 进行 一 系列 这 种 试验 或 观察 
所 得 的 结果 却 是 不 尽 相同 的 。 像 这 类 在 一 定 条 件 下 可 能 出 现 的 结果 不 止 一 个 ,至 于 出 现 哪 一 
个 ,事先 又 无 法 确定 的 现象 称 为 随机 性 现象 。 如 某 一 地 区 在 某 一 天 的 降雨 量 , 电 话 交换 台 在 单 
位 时 间 内 收 到 的 呼唤 次 数 等 皆 为 随机 性 现象 。 

2. 随 机 试验 和 样本 空间 

自然 界 和 人 类 社会 中 各 种 各 样 的 现象 常常 在 人 们 所 进行 的 试验 或 观察 中 呈现 出 来 ,我 们 
把 呈现 出 随机 性 现象 的 试验 或 观察 称 为 随机 试验 , 记 为 Eo 

在 进行 一 个 随机 试验 时 ,试验 的 所 有 可 能 结果 应 该 是 明确 知道 的 ,每 一 个 结果 被 称 为 样本 
点 ,用 o 表示 。 由 样本 点 o 的 全 体 构成 的 集合 称 为 样本 空间 ,用 0 来 表示 , 记 为 0 = lolo 

【 例 1- 1】 掷 一 枚 般 子 ,试验 的 所 有 可 能 结果 有 6 个 , 即 w = "17,0; = “2”, w = “3”, wa 
= “4" ,as =“5”,we = “6", 则 样本 空间 为 

A = laj ,003,005 ,0, „005 „cogl 

【 例 1-2】 观察 电话 交换 台 在 单位 时 间 内 收 到 的 呼唤 次 数 ,车 用 表示 “在 单位 时 间 内 

收 到 让 次 呼唤 "这 一 结果 ,k =0,1,2,…, 则 样本 空间 为 
A = |0,1,2,.…| 











3. 随 机 事件 

在 一 个 随机 试验 中 ,对 一 次 试验 而 言 , 可 能 出 现 也 可 能 不 出 现 的 事情 , 称 为 随机 事件 , 记 为 
4 。 对 一 个 随机 试验 来 说 ,显然 , 它 的 每 一 个 可 能 的 结果 ( 即 每 个 样本 点 ) 都 是 一 个 随机 事件 ， 
我 们 称 之 为 基本 事件 , 像 例 1 - 1 中 出 现 6 点 的 事件 即 为 一 个 基本 事件 。 在 一 个 随机 试验 中 ， 
除了 基本 事件 外 ,还 有 由 若干 个 可 能 结果 ( 即 若干 个 样本 点 ) 所 组 成 的 事件 ,相对 于 基本 事件 ， 
称 这 种 事件 为 复合 事件 ,如 例 1 - 1 中 出 现 偶数 点 的 事件 即 为 一 个 复合 事件 。 

4. 频 率 与 概率 

在 相同 条 件 S 下 ,重复 进行 n 次 试验 ,车 在 n 次 试验 中 ,事件 4 发 生 的 次 数 (可 称 为 频数 ) 


为 mv , 则 比值 皖 称 为 事件 4 在 次 试验 中 发 生 的 频率 户 即 
a 
fey (1-1) 
如 果 当 n 充分 大 时 ,4 发 生 的 频率 具 稳 定 地 在 某 一 数值 附近 摆动 ,而 且 一 般 来 说 随 着 试 


验 次 数 的 增多 ,这 种 摆动 的 幅度 越 变 越 小 , 即 频率 澡 越 来 越 稳定 于 p, 则 称 p 为 此 随机 试验 中 


随机 事件 4 发 生 的 概率 , 记 作 
P(A) =p (1-2) 
【 例 1-3】 表 1- 1 为 17 块 岩心 的 实测 岩石 密度 数据 ,假设 事件 : A, = [2.65,2.68];4, 
= [2.68,2.71 ] ;4，= [2.65,2.71];4, = [2.66,2.69], 计算 各 事件 的 概率 。 


7 9 
解 : P(A,) = = 0.412;P(A,) = 17= 


0.529; P(A,) = IŚ = 0.941; 
P(A.) = Ę = 0.706 


表 1-1 实测 岩石 密度 数据 表 












































岩心 号 HAMM p on e 岩石 密度 p,glem [岩心 号 | 岩石 密度 pom 

1 2.68 7 2.6 | s | 2.6 

2 2.68 s | 2.70 | u 2.68 

3 2.68 | 9 2.68 15 2.68 

4 2.69 | 10 2.69 | 16 2.68 A 

5 2.69 11 2.70 1 7 2.70 

6 2.70 - 12 | 2.74 i 

5. 事 件 之 间 的 关系 与 运算 


1) 包 含 关系 

若 事件 4 发 生 时 ,事件 B 必 发 生 , 则 称 事件 B 包含 事件 4, 见 图 1- 1(a), 记 为 4CB。 例 
1- 3 中 的 A, 包含 事件 4, ,同时 ,4; 也 包含 事件 Ao 

2) 事 件 的 和 

若 某 事件 发 生 当 且 仅 当 事件 4 与 事件 B 中 至 少 有 一 个 发 生 ( 或 者 说 当 且 仅 当 事件 4 RE 
或 事件 B 发 生 ) , 则 称 此 事件 为 事件 4 与 事件 B 的 和 见 图 1- 1(b), 记 为 4+ B 或 4UB。 

3) 事 件 的 积 

FA 














© c) GC) D 
ACB A+B AB 
(a) (b) (e) 

¢ o LO 
A-B 1 AB= 6 
(d) (e) (0 


图 1-1 事件 之 间 关系 及 运算 示意 图 

若 某 事件 发 生 当 且 仅 当 事 件 4 与 事件 8 同时 发 生 , 则 称 此 事件 为 事件 4 与 事件 B 的 积 , 见 
图 1-1(e), 记 为 48 或 4 门 B。 例 1 - 3 中 事件 4 A A 的 积 (同时 发 生 ) 为 事件 [2.66,2.68]。 

4) 事 件 的 差 

若 某 事件 发 生 当 且 仅 当 事 件 4 发生 而 事件 8 不 发 生 , 则 称 此 事件 为 事件 A 与 事件 B 的 差 ， 
见 图 1-1(d), 记 为 4-B。 

5) 对 立 事件 

事件 “4 RRE” 为 事件 4 的 对 立 事件 , 记 为 4, 见 图 1-1(e)。 

6) 互 不 相 容 事件 

若 事件 A 与 事件 B 不 能 同时 发 生 , 则 称 事件 4 与 事件 有 为 互 不 相 容 事件 , 见 图 1 - 1(f)。 
例 1-3 中 4, 和 A, 两 个 事件 即 为 互 不 相 容 事件 。 

6. 概 率 的 可 加 性 

1) 概 率 的 有 限 可 加 性 

若 事件 A, 4，,…, A, 两 两 互 不 相 容 , 则 

P(A, + A; ++ +A,) = P(A,) + P(A,) + + P(A,) (1 - 3a) 
式 (1- 3a) 也 可 写成 如 下 形式 


POSA) = SPA) (1 - 3b) 
fi 台 


2) 概 率 的 可 列 可 加 性 
若 事件 4, , 4,,… ,4,… 两 两 互 不 相 容 , 则 


POÓJA) = SPA) (1-4) 
二 条件 概率 公式 和 概率 的 乘法 公式 


1. 条 件 概率 公式 
随机 事件 4 的 概率 是 在 条 件 S 之 下 来 考虑 的 , 若 除 条 件 S 之 外 ,不 再 附加 任何 条 件 , 则 称 
RE 








这 种 概率 为 无 条 件 概率 ,反之 , 则 为 条 件 概率 。 
设 A,B 是 某 随机 试验 中 (或 条 件 S 下 ) 的 两 个 事件 P(A) 20. 称 事件 B 在 “事件 4 已 发 
生 " 这 一 附加 条 件 下 的 概率 为 事件 4 已 发 生 条 件 下 事件 B 的 条 件 概率 , 记 P( B/4)。 条 件 概 
率 可 由 条 件 概率 公式 求 得 
P(BIA) = A P(A) > 0 Q - 5) 
【 例 1-4】 在 某 区 块 钻 5 口 并 ,5 口 井 都 钼 穿 了 侏 罗 系 三 工 河 组 S 砂 层 组 ,该 砂 层 顶 部 、 
中 部 和 底部 的 沉积 相 在 5 口 井中 的 揭示 情况 见 表 1 - 2, 现 正在 钻 第 6 口 井 ,已 钼 到 S, 砂 层 组 
的 中 部 ,其 沉积 相 为 F , 试 分 析 这 口 井 在 S, 砂 层 组 底部 发 育 F 沉积 相 的 可 能 性 有 多 大 ? 


R1-2 某 区 块 5 口 井 侏 罗 系 三 工 河 组 S, 砂 层 组 沉积 相 分 布 情况 





























位 置 ] EX EA Ha NEX | EA 
ELS K PP F R FL 
中 部 F, Fi _ R F, h 
底部 A B A F F 











解 : 设 事件 4 = [F, 是 S, 砂 层 组 中 部 的 沉积 相 ] ,事件 B = [F, 是 S, 砂 层 组 底部 的 沉积 
相 ] ,那么 ,要 回答 的 问题 是 当 事 件 4 发 生 时 ,事件 B 发 生 的 条 件 概率 。 
根据 表 1- 2 的 信息 ,我 们 有 


P(A) = $,P(B) = 5 





事件 共同 发 生 的 概率 为 P( 4B) = 子 , 则 在 事件 A 已 发 生 的 条 件 下 事件 B 发 生 的 概率 为 


P(AB) _ 2/5 2 
P(B/A) = PA = 3157 3 
故 有 ; 当 第 6 PIJE S, 砂 层 组 的 中 部 沉积 相 为 F 时 ,在 S, 砂 层 组 底部 发 育 F, 沉积 相 的 可 
能 性 为 23。 
2. 概 率 的 乘法 公式 
由 式 (1 - 5) 可 得 概率 的 乘法 公式 
P(AB) = P(A)P(B/A) (1-6) 
在 关系 式 P(4B) = P(A)P(B) 成 立 的 前 提 下 , 称 事件 4 和 B 相互 独立 。 
注意 ,在 讨论 两 个 事件 4 和 有 的 独立 性 时 ,4 和 有 必须 是 相 容 事件 , 井 则 ,就 无 从 谈 其 而 立 与 否 。 
在 例 1-4 中 , P(AB) = È < P(A)P(B) = 基 , 故 4 和 有 两 个 事件 不 是 相互 独立 的 ,也 
就 是 说 ,在 4 发 生 时 ,对 有 发 生 的 概率 会 产生 影响 。 
三 、 全 概率 公式 和 概率 树 
1. 全 概率 公式 
在 实际 问题 中 ,我 们 常常 遇 到 这 样 的 事件 B, 它 总 是 与 若干 个 两 两 互 不 相 容 的 事件 A, 
AnA, 之 一 同时 发 生 。 这 时 ,为 了 计算 事件 了 的 概率 ,可 先 把 事件 也 分 解 为 一 些 不 相 容 的 简单 
事件 之 和 , 即 B = BA, + BA, + … + B4., 然 后 分 别 计算 和 式 中 的 简单 事件 的 概率 ,再 利用 概率 
的 可 加 性 ,最 终 得 到 P(B)。 下 面 , 先 从 实例 分 析 入 手 ,引出 全 概率 公式 。 
EBG 





[511-5] 某 油层 中 有 三 种 沉积 微 相 , 已 知 其 中 第 一 、 第 二 和 第 三 种 沉积 微 相 各 占 总 量 
的 50% ,25% 和 25% ,又 知 第 一 、 第 二 和 第 三 种 沉积 微 相 高 渗透 ( > 100 x 10 pm ) 岩 心 出 现 的 
概率 分 别 为 1% .2% 和 4% ,现任 取 一 个 岩心 , 问 取出 的 岩心 具有 高 渗透 率 的 概率 有 多 大 ? 
解 : 设 4; =“ 取 出 的 岩心 是 第 i 种 沉积 微 相 ”, 则 有 
P(A,) = 50%, P(A,) = 25%,P(A,) = 25% 
再 设 B=“ 取出 的 岩心 是 高 渗透 率 ” ,事件 B 总 是 与 三 个 不 相 容 的 事件 A A, 和 A, 之 一 同 
时 发 生 , 且 P(B/A,) =1% ,P(B/4:) =2% ,P(B/4;) =4% ,根据 全 概率 公式 ,事件 B 的 概率 为 


P(B) = SI PAB) = S PCA) PCBIA,) 
= 50% x 1% x 25% x 2% x 25% x 4% = 2% 
显然 ,事件 C =“ 取 出 的 岩心 不 是 高 渗透 率 "的 概率 为 
P(C) = 1- P(B) =1-2% = 98% 
由 以 上 实例 分 析 ,可 引出 全 概率 公式 如 下 : 
设 :(1)4, ,4:，…4, 两 两 互 不 相 容 ,P(4) >0 (i=1,2,…,n) 


(28 C XJA CME B IREX) A, 中 ) 
则 有 


P(B) = SI P(A)P(B/A) = SI PAB) (1-7) 
m 


2. 概 率 树 
我 们 可 以 用 树 形 结构 图 清晰 地 表示 事件 之 间 的 概率 关系 , 例 1 - 5 中 事件 之 间 的 概率 关系 
可 用 图 1 -2 所 示 的 概 举 树 来 表示 。 
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图 1-2 例 1-5 中 事件 之 问 概率 关系 的 概率 树 
四 、 贝 叶 斯 公式 和 逆 概率 树 


1. 贝 叶 斯 公式 
在 实际 工作 中 还 常常 碰 到 这 样 一 类 问题 :已 知 某 个 试验 结果 是 由 许多 原因 导致 的 ,如 果 人 
们 通过 试验 观察 到 这 个 结果 ,于 是 人 们 希望 通过 这 个 信息 来 探讨 ( 反 求 ) 每 个 “原因 ”导致 这 个 
结果 的 可 能 性 有 多 大 ,如 例 1-4 中 , 若 已 知 取出 的 一 个 样品 为 高 渗透 样品 , 问 这 个 样品 属于 第 
«9. 





一 ,第 二 和 第 三 种 沉积 微 相 的 可 能 性 有 多 大 ? 由 此 引出 贝 叶 斯 问题 , 贝 叶 斯 问题 实际 上 是 逆 概 
率 问题 ,在 决策 过 程 中 有 十 分 重要 的 应 用 价值 , 贝 叶 斯 公式 由 下 列 方式 表述 : 

车 有 一 组 事件 A, ,4,…4. 以 及 事件 8, 它们 满足 公式 (1 -7) 中 相同 的 条 件 , 而 且 P(B) > 
0, 则 有 贝 叶 斯 公式 
AD BÓBIAJ = = FUD G=L2s",n; i=126,n) (1-8) 
ZPA, ) P(BIA,) 


实际 上 ， 式 (1- 8) 的 贝 叶 斯 公式 可 根据 条 件 概率 公式 和 全 概率 公式 直接 推导 出 来 。 

由 式 (1- 8) 所 计算 的 概率 称 为 后 验 概率 , 它 实质 上 是 B 发 生 条 件 下 A, 发 生 的 条 件 概率 ， 
这 不 同 于 A, 本 身 发 生 的 概率 , 称 为 先 验 概率 。 

下 面 , 用 一 个 例子 来 说 明 贝 叶 斯 公式 的 应 用 。 

【 例 1- 6】 回 到 刚刚 提出 的 问题 上 , 即 在 例 1- 5 中, 若 已 知 取出 的 一 个 岩心 样品 为 高 滩 
透 率 样品 , 问 这 个 样品 属于 第 一 第 二 和 第 三 种 沉积 微 相 的 可 能 性 各 有 多 大 ? 

解 :由 贝 叶 斯 公式 可 计算 取出 的 一 个 样品 为 高 渗透 率 样品 (事件 8) 时 ,该 样品 为 第 一 ,第 
二 和 第 三 种 沉积 微 相 的 概率 分 别 为 


P(A/B) = 





P(A,/B) = 12% — = 25% 
P(A,/B) = BE, z2% = 25% 
P(A/B) = ase xan = 50% 


故 有 : 当 已 知 取出 的 一 个 样品 为 高 渗透 率 样品 时 ， 这 个 样品 属于 第 一 .第 二 和 第 三 种 沉积 
微 相 的 可 能 性 分 别 为 25% ,25% Kl 50% o 

2. 逆 概率 树 

贝 叶 斯 公式 可 用 逆 概 率 树 清晰 地 图 示 表 达 , 例 1 - 6 中 的 逆 概 率 问题 可 用 图 1 - 3 中 的 逆 
概率 树 来 表达 ,为 了 构建 图 1 - 2 中 的 逆 概 率 树 ,还 需要 计算 出 已 知 取出 的 一 个 样品 为 低 渗透 
样品 (事件 C) 时 ,这 个 样品 属于 各 沉积 微 相 的 可 能 性 , 即 





第 一 种 沉积 微 相 
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图 1-3 deR 





50% x 9% 





P(A,/C) = 0.98 = 50-5% 
P(A,IC) = ZOB _ 25% 
P(AIC) = 2x H% _ 24 59, 


0.98 


第 二 节 ”概率 论 在 油气 勘探 风险 分 析 和 
圈 闭 期 望 价值 计算 中 的 应 用 


一 \ 油 气 勘探 中 的 风险 和 成 功 概率 


1 .油气 勘 探 中 的 风险 

无 论 在 哪个 经 济 领 域 进 行 投资 ,风险 因素 都 是 投资 者 所 必须 考虑 的 因素 之 一 。 油 气 勘 控 
是 寻找 发 现 圈 闭 ,评价 其 经 济 可 行 性 (风险 性 )。 钻 探 目 标 ,直至 发 现 商业 性 油气 藏 的 过 程 ,是 

-个 高 投资 高 风险 、 高 收益 的 领域 。 油 气 勘 探 的 风险 包括 地 质 风险 ,工程 风险 经 济 风险 和 政 

治 风险 等 ,其 中 ,地 质 风险 是 最 根本 的 。 

地 质 风险 涉及 有 无 油气 及 有 多 少 油气 的 问题 ,石油 深 埋 在 地 下 几 百 米 到 几 千 米 ,其 生成 、 
运 移 和 保存 等 过 程 ,都 有 许多 不 确定 性 ,虽然 人 们 的 认识 在 不 断 加 深 , 且 科 学 技术 在 不 断 进步 ， 
但 这 种 认识 与 实践 ,预测 与 实际 之 间 仍 常常 发 生 偏离 ,这 就 存在 着 风险 的 可 能 性 ,如 表 1 - 3 为 
AAPG 钻井 资料 统计 委员 会 (CSD) 收 集 的 美国 钻井 统 计 资 料 ,说 明了 各 类 井 的 历史 统计 成 功 
率 ,新 区 野猫 井 的 勘探 成 功率 只 有 13% ~ 18%。 


表 1-3 CSD 报道 的 20 世纪 80 年 代 美 国 陆 上 和 海上 不 同类 型 井 的 成 功率 
ES 成 功率 | 井 类 型 | woe | sw 成 功率 
JK | 15%-%0% | BOOM | 。 40% -45% | m | ”13% 18% 
所 有 探 井 20% ~ 30% 25% ~ 35% 





























2. 成 功 概率 的 定义 

对 一 个 给 定 的 图 闭 ,地 质 学 家 能 够 估计 出 关键 地 质 因 素 ( 储 集 岩 , 烃 类 充 注 等 ) 存 在 的 概率 
值 ,这 些 地 质 因 素 被 认为 是 地 下 油气 聚集 的 必要 条 件 , 这 就 引出 了 烃 类 存在 的 概率 或 地 质 成 功 
率 的 估计 问题 。 

我 们 常常 会 碰 到 这 样 一 些 问题 :回收 完 井 成 本 及 后 续 生 产 操作 费用 的 成 功率 有 多 大 ? 同 
时 回收 钻井 费用 的 成 功率 有 多 大 ? 获得 合理 利润 的 概率 有 多 大 ?因此 ,成 功 概率 有 许多 种 定 
义 , 用 来 有 效 地 预测 成 功 概率 的 技术 是 存在 的 ,但 应 用 这 些 技术 时 需要 使 用 关 十 成 功 概率 的 一 
致 的 严格 的 定义 (图 1 -4)。 

(1) 地 质 成 功 井 一 一 钻 遇 可 流动 的 \ 可 计量 的 烃 类 的 井 。 

(2) 完 井 成 功 井 一 一 可 完 井 投入 生产 的 井 。 

《3) 边 际 成 功 井 一 一 忽略 探 井 钻探 成 本 (作为 沉没 成 本 ) , 仅 考虑 完 井 和 生产 操作 成 本 才能 
BARKI 

(4) 商 业 成 功 井 一 一 发 现 的 油气 能 够 负担 开发 井 、 完 井 、 地 面 设施 、 生 产 操作 成 本 、 井 口 税 ， 

KU 











失败 


储 层 不 存在 TE 
T T T 
10% 20% 30% 40e  S0% 





Ba 











、 I 
Psg ~ Ps Py 1 
N, t 
一、 全 mas we 一 | 
NJ EPH 20% ———| 


— 





mi —— 











图 1-4 不 同 成 功 概率 定义 示意 图 
图 中 px 表示 地 质 成 功率 , Ps 表示 完 间 成 功率 , Ps 表示 商业 成 功率 

并 能 在 回收 相应 数目 的 于 井 成 本 的 基础 上 获得 合理 的 利润 的 发 现 井 。 注 意 ,这 个 定义 容许 包 
括 一 小 部 分 并, 这 部 分 井 的 发 现 不 能 负担 其 它 的 勘探 成 本 ,如 地 质 和 地 款 物 理 (G&G ) 勘 探 成 
本 \ 矿 区 租金 以 及 相应 数目 的 干 井 成 本 。 

3. 地 质 机 会 因子 和 成 功 概率 

对 于 所 有 的 勘探 国 闭 ,地质 勘探 人 员 都 应 该 独立 地 给 出 任何 一 个 圈 闭 的 4 个 重要 地 质 机 
会 因子 存在 的 概率 。 

1) 有 效 储 集 层 

孔隙 度 和 渗透 率 达到 生产 标准 ,最 小 厚度 足以 容纳 可 计量 的 、 可 流动 的 油气 ,或 足以 促使 
审慎 的 国内 陆 上 勘探 者 冒险 完 并 的 储 集 层 存在 的 概率 有 多 大 ? 

一 个 公司 用 油气 的 可 流动 性 ,以 满足 某 种 最 低 标准 的 需要 。 在 任何 情况 下 ,我 们 所 寻求 的 
是 地 质 人 员 关于 一 个 最 小 规模 储 集 层 存在 的 置信 度 一 一 厚度 .孔隙 度 和 有 效 渗透 率 。 在 此 情 
况 下 , 钻 遇 水 层 但 却 是 一 个 具有 商业 质量 的 砂岩 储 层 就 储 集 层 来 说 不 算是 失败 ,但 从 另外 几 方 
面 来 说 ,如 图 闭 幅度 低 .缺乏 烃 类 充 注 或 圈 闭 漏 失 ,钻探 则 是 失败 的 。 然 而 ,在 预测 有 10 英尺 
孔隙 砂岩 存在 的 目的 层 钻 遇 的 是 1 英尺 的 致密 砂岩 ,就 储 集 层 的 角度 来 说 钻探 则 是 失败 的 。 
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2) 构 造 落 实 程度 

平面 图 和 剖面 图 上 展示 的 目的 层 的 构造 能 够 代表 地 下 真实 构造 的 概率 有 多 大 ? 在 这 里 并 
不 是 指 圈 闭 本 身 是 否 存在 ,而 是 指 圈 闭 平面 图 和 剖面 图 描述 地 下 真实 情况 的 准确 程度 。 

这 个 地 质 机 会 因子 常常 应 用 于 地 层 和 构造 圈 闭 预测 ,而 且 毫 无 疑问 在 大 多 数 勘探 和 开发 工 
程 中 ,构造 图 通常 都 是 惟一 最 重要 的 图 件 。 同 样 ,构造 解释 的 偏差 也 是 造成 干 井 的 普遍 原因 。 

地 质 构造 概率 因子 结合 储 层 条 件 ,主要 用 于 描述 设想 存在 的 油 藏 或 气 藏 的 几何 形态 和 流 
体 体积 ,而 这 两 方面 对 于 进行 生产 试验 或 审慎 的 钻 杆 测试 都 是 必要 的 。 

3) 烃 类 物质 基础 

地 下 地 质 环境 中 存在 烃 而 且 圈 闭 已 经 接收 到 一 -定量 烃 类 的 概率 有 多 大 ?这 个 地 质 机 会 因 
子 描述 诸如 源 岩 体积 是 否 足够 大 、 是 否 有 油 和 /或 气 生成 油气 到 圈 闭 的 运 移 通道 以 及 储 集 层 
流体 中 烃 类 饱和 度 的 问题 .时间 匹 配 问题 此 处 不 予 论述 。 在 大 多 数 新 近 展开 勘探 的 盆地 中 ,对 
烃 类 充 注 的 置信 度 相 对 较 低 ,而 在 勘探 程度 较 高 的 盆地 中 和 正在 开发 的 区 带 中 ,对 烃 类 充 注 的 
置信 度 是 比较 高 的 。 

4) 时 间 匹 配 

根据 所 描述 的 岩 性 组 合 和 构造 形态 , 圈 闭 存在 以 及 油气 运 移 到 圈 闭 区 域 时 图 闭 已 经 形成 
的 概率 有 多 大 ? 这 里 我 们 讨论 : :个 问题 ,首先 是 储 集 层 与 项. 底 和 侧 向 封 隔 层 之 间 的 封闭 性 
(不 论 是 地 层 成 因 还 是 断层 成 因 的 ) ,流体 粘度 .地层 厚度 .差异 渗透 率 和 断层 活动 历史 都 影响 
Tame, 其 次 是 前 面 第 三 条 中 提 到 的 时 间 匹 配 问 题 : 如 果 圈 闭 在 油气 运 移 之 后 才 形 成 ,那么 

也 等 马 都 跑 出 后 才 把 门 关 上 "没什么 区 别 了 。 第 三 个 问题 是 后 期 淡水 冲刷 和 储 集体 内 的 烃 发 
生 降 解 可 来 的 保存 问题 这 里 所 用 的 术语 “ 圈 闭 "没有 任何 几何 形状 和 构造 形态 的 含义 一 一 只 
有 容量 和 封闭 性 , 疾 闭 充满 程度 这 个 束 手 的 问题 就 属于 这 个 讨论 范畴 ,最 好 用 百分数 来 描述 。 
对 于 大 多 数 开发 井 , 圈 闭 封闭 条 件 都 已 经 满足 

把 以 上 4 个 地 质 机 会 因子 都 看 作 具 有 概率 范围 为 0 ~ 1 的 独立 变量 ,4 个 因子 连 乘 得 到 油 
气 藏 存在 的 概率 。 在 美国 陆 上 探 区 中 ,根据 以 上 定义 的 这 4 个 地 质 因素 的 4 个 概率 值 的 连 乘 
积 与 完 井 成 功 概率 非常 接近 ,把 它 记 为 成 功 概率 P,, 由 此 可 以 得 到 失败 的 概率 Pi, 此 处 1.0- 
已, = P;。 因 此 从 定义 来 说 ,P, 与 完 井 成 功 概率 非常 致 ,如 图 1 -4 所 示 。 


二 、 圈 闭 期 望 价值 的 计算 


1. 圈 闭 期 望 价 值 的 概念 

油气 勘探 风险 项 目的 经 济 分 析 必 须 在 这 样 的 假设 前 提 下 进行 : 即 项 目 是 成 功 的 ,这 种 成 功 
通常 被 表述 为 盈利 性 的 几 个 等 级 之 一 ,而 盈利 性 是 由 影响 项 目 商业 性 的 地 质 技术 经 济 参数 的 
不 同 范围 确定 的 。 例 如 ,一 个 机 构 可 以 通过 预测 的 储量 规模 的 最 小 值 RAPHA .平均 值 和 最 
大 值 进行 经 济 评价 (注意 圈 闭 储量 分 布 最 好 的 单个 代表 值 是 平均 值 )。 许 多 勘探 项 目 失败 了 ， 
这 种 失败 的 后 果 在 评价 钻探 团 闭 的 经 济 价值 时 应 该 考虑 进去 。 期 望 价值 ( EY ) 既 包括 了 钻 并 
成 功 与 失败 的 概率 ,又 包括 了 成 功 与 失败 所 对 应 的 两 种 经 济 后 果 : 

= P, x (项 目 净 现 值 ) + P, x (失败 成 本 ) a- 

RH, P, 和 Pi 分 别 对 应 成 功 和 失败 的 概率 。 

面 对 多 种 选择 ,而 且 每 种 选择 的 期 望 价值 均 为 正 值 ,决策 原则 为 选择 期 望 价值 最 高 的 选 
项 。 很 明显 ,如 果 有 人 选择 了 期 望 价值 为 负 值 的 风险 项 日 , 那 他 就 是 在 赌博 。 
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在 勘探 风险 项 目 中 , 圈 闭 的 净 现 值 ( NPY) 的 计算 通常 要 考虑 所 有 的 前 期 勘探 成 本 。 勘 控 

失败 的 成 本 通常 包括 干 井 成 本 ,租金 和 地 质 、 地 球 物理 勘探 成 本 。 对 于 特别 大 的 图 闭 还 要 包括 
- 口 或 多 口 探 边 井 的 成 本 。 

2. 图 闭 期 望 价 值 的 应 用 

期 望 价值 在 油气 勘探 风险 项 目 分 析 中 是 很 有 用 的 概念 , 它 使 我 们 能 够 对 不 同 圈 闭 的 价值 
进行 权衡 。 通 过 它 , 可 以 在 具有 较 大 储量 潜力 但 成 功 概率 较 小 和 储量 潜力 适中 但 成 功 概率 较 
大 的 圈 闭 之 间 进 行 对 比 。 例 如 ,在 表 1- 4 中 只 需 通过 期 望 价值 ( BY) 就 可 以 判断 圈 闭 A ERA 
闭 8 好 ,其 原因 是 圈 闭 A 具有 较 高 的 期 望 价值 。 然 而 ,决策 者 实际 上 可 能 会 选择 圈 闭 B ,以 较 
高 的 成 功 概率 和 较 低 的 前 期 成 本 换取 较 少 的 回报 。 即 使 这 样 ,期 望 价值 在 确定 和 处 理 这 个 例 
子 中 的 风险 规避 行为 时 还 是 很 有 用 处 的 。 

R1-4 两 个 图 闭 期 望 价值 的 计算 与 对 比 

m A 计算 方法 








10000 惨 平 均 储量 扣除 所 得 税 后 的 估计 现 值 = 30,000,000$ 
估计 的 成 功 概率 = 10% ,失败 概率 = 90% 





nRa 扣除 所 得 税 后 的 干 井 成 本 估计 值 = -2,500,000 $ 
EV =0.10( + 30,000,000 $ ) + 0.90( - 2,500,000$ ) = + 750,000 $ 
10000 桶 平均 储量 扣除 所 得 税 后 的 估计 现 值 = 30,000,000 $ 

MIA B 估计 的 成 功 概率 = 40% ,失败 概率 = 60% 


扣除 所 得 税 后 干 井 成 本 的 估计 值 = -1,000,000 $ 
EV=0.40( + 30,000,000 $ ) + 0.60( — 1,000,000$ ) = +600,0008 














圈 闭 排队 表 在 预测 勘探 部 署 总 的 结果 中 具有 相当 大 的 价值 , 它 的 使 用 可 融合 到 各 级 勘探 
部 门 及 整个 油 公 司 的 勘探 部 署 中 ,该 表 的 建立 有 赖 于 图 闭 期 望 价值 的 确定 。 决 策 树 分 析 也 有 
赖 于 可 靠 的 期 望 价值 数据 。 


第 三 节 ”概率 论 在 油气 勘探 风险 决策 中 的 应 用 


一 、 决 策 理论 基础 


决策 是 为 解决 当前 或 未 来 可 能 发 生 的 问题 选择 最 佳 方案 的 一 种 过 程 , 它 贯 穿 于 管理 的 全 
过 程 ,因而 ,可 以 说 决策 是 管理 的 核心 。 传 统 的 决策 乃 是 经 验 的 决策 , 它 仅 依赖 于 决策 人 员 个 
人 的 经 验 和 勇气 。 近 30 年 来 ,由 于 电子 计算 机 技术 的 迅速 发 展 ,使 得 人 们 能 够 运用 概率 论 及 
数理 统计 的 原理 对 需 决策 的 问题 进行 定量 化 分 析 并 从 中 优选 出 最 佳 方案 。 目 前 ,决策 科学 已 
成 为 管理 科学 和 应 用 统计 学 的 一 个 主要 组 成 部 分 。 

1 .决策 分 类 

按照 对 自然 状态 的 认识 程度 , 待 决策 问题 可 分 为 三 类 。 

1) 确 定型 决策 

在 决策 时 有 完全 充分 的 情报 或 信息 可 以 把 握 未 来 的 客观 环境 , 即 未 来 的 自然 状态 是 完全 
肯定 的 这 样 一 类 决策 ,这 类 决策 常 采用 线性 规划 `\ 动 态 规划 和 网 络 规划 等 最 优化 技术 。 

2) 非 确定 型 决策 

wąs: 





在 决策 时 ,只 知道 未 来 可 能 存在 的 几 种 自然 状态 ,但 这 些 自然 状态 以 多 大 的 可 能 性 出 现 则 
一 无 所 知 。 在 进行 非 确定 型 决策 时 ,需要 知道 损益 矩阵 ( 表 1 - 5)。 非 确定 型 决策 方法 包括 最 
大 收益 值 法 (乐观 法 )、 最 大 最 小 收益 值 法 (悲观 法 , Wald 决策 准则 ) .最 小 最 大 后 悔 值 法 (Regret 
Value ) 和 等 可 能 决策 准则 (Laplace 准则 )。 











表 1-5 损益 矩阵 
Si Są S, 
Vu Va vi 
Va Vn V, 
An Vi s LĄ 











对 于 同样 一 个 待 决策 问题 ,使 用 不 同 的 方法 一 般 将 导致 不 同 的 最 佳 决 策 方案 。 由 于 对 自 
然 状态 出 现 的 可 能 性 大 小 一 无 所 知 , 所 以 ,很 难 制定 一 个 评判 方法 好 坏 的 客观 标准 。 因 此 对 于 
非 确定 型 决策 问题 ,很 大 程度 上 仍然 依赖 于 决策 者 持 有 的 心理 状况 。 为 了 使 决策 更 加 合理 ,一 
般 应 对 自然 状态 出 现 的 概率 加 以 预测 ,进而 使 用 较为 客观 的 尺度 对 决策 方案 进行 取舍 ,而 这 就 
是 接着 要 谈 的 风险 型 决策 问题 。 

3) 风 险 型 决策 

在 通常 的 情况 下 ,人 们 虽然 不 能 完全 确定 未 来 的 自然 状态 是 什么 ,但 总 可 以 通过 各 种 手段 
预测 出 未 来 自然 状态 出 现 的 概率 。 风 险 型 决策 亦 称 统计 型 决策 或 随机 型 决策 ,进行 这 类 决策 ， 
除 已 知 损益 矩阵 外 ,还 必须 掌握 各 自然 状态 发 生 的 概率 ( 表 1 - 6)。 风 险 型 决策 可 分 为 最 大 可 
能 法 和 期 望 值 决策 法 。 尽 管 依据 概率 的 决策 必然 会 有 风险 ,但 是 由 于 遵从 了 统计 规律 ,所 以 这 
种 方法 比 赁 直观 想象 进行 决策 要 合理 和 有 效 得 多 ,是 一 种 较 好 的 常用 的 决策 方法 。 

表 1-6 已 知 各 自然 状态 出 现 概率 条 件 下 的 损益 矩阵 











Si Pi SPa R Sw Pa 
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(1) 最 大 可 能 决策 法 。 

最 大 可 能 法 将 风险 型 决策 问题 当 作 确定 型 问题 来 处 理 ,鉴于 已 知 各 自然 状态 发 生 的 概率 ， 
最 大 可 能 法 要 求 将 发 生 概率 最 大 的 自然 状态 作为 必然 出 现 的 自然 状态 来 对 待 ,而 将 其 它 发 生 
概率 较 小 的 自然 状态 视 为 不 可 能 事件 。 

(2) 期 望 值 决策 法 。 

期 望 值 决策 法 把 每 个 备 选 方案 都 看 成 是 随机 变量 ,其 取 值 就 是 该 方案 对 应 于 各 自然 状态 
的 损益 值 , 即 损益 矩阵 中 同一 行 的 各 元 素 ( 表 1 - 5)。 期 望 值 决策 法 在 具体 解 题 时 可 采用 多 种 
分 析 问 题 的 形式 ,如 决策 表 、 决 策 树 等 。 
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2. 灵 敏 度 分 析 

在 一 定 范围 内 变动 各 自然 状态 出 现 的 概率 及 相应 各 方案 的 损益 的 大 小 而 对 最 佳 决策 方案 
的 稳定 性 进行 讨论 。 在 此 , 需 引 入 转折 概率 的 概念 ,所 谓 转 折 概 率 是 指 每 一 备 选 方案 在 不 同 自 
然 状 态 下 的 损益 值 都 不 发 生变 化 的 前 提 下 ,使 各 个 备 选 方案 具有 相同 损益 期 望 值 的 自然 状态 
出 现 的 概率 。 灵 敏 度 分 析 指出 了 最 佳 方案 的 适应 性 和 稳定 性 。 

3. 效 用 理论 

在 风险 型 决策 中 , 同 量 的 损益 值 因 决策 的 风险 不 同 会 给 同一 决策 人 员 带 来 不 同 的 满足 程 
度 ,效用 曲线 有 3 种 类 型 (图 1- 5)。 
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图 1-5 效用 曲线 

图 1 - 5 中 的 直线 反映 一 种 严格 按 损 益 期 望 值 决策 的 人 对 待 风险 的 态度 。 向 左上 方 凸 出 
的 曲线 反映 -种 较为 保守 的 决策 人 员 对 待 风险 的 态度 ,从 本 质 上 来 说 ,这 类 人 员 对 损失 比较 敏 
感 ,对 利益 的 反应 比较 退 缓 ,对 风险 持 -种 厌恶 态度 。 向 右 下 方 凸 出 的 曲线 反映 一 种 富 于 进取 
精神 的 决策 人 员 对 待 风险 的 态度 ,从 本 质 上 来 说 ,这 类 人 员 对 利益 比较 敏感 ,对 损失 不 太 介意 ， 
是 一 种 敢 冒 风险 的 人 物 。 

对 大 量 统计 资料 的 分 析 表 明 , 大 多 数 的 决策 人 员 属于 保守 型 的 , 敢 冒 风险 和 严格 按期 望 值 
大 小 进行 决策 的 人 仅 占 少数 。 


二 、 基 于 期 望 货币 值 的 决策 方法 


基于 期 望 货币 值 决策 方法 的 原理 ,是 计算 出 每 个 方案 的 期 望 货币 价值 并 选择 期 望 货币 价 
值 最 大 的 方案 ,用 决策 树 可 使 这 一 过 程 清晰 明了 ,决策 树 是 概率 树 在 风险 决策 中 的 应 用 ,下 面 
用 一 个 例子 说 明 该 方法 的 应 用 

【 例 1-7】 某 油 公 司 就 某 - -勘探 区 块 有 如 下 决策 选择 :(1) 立 即 卖 掉 区 块 勘探 开发 权 , 获 
得 125k $ ;(2) 年 后 卖 掉 区 块 勘探 开发 权 , 若 油价 下 降 , 获 100k $ ( 折 现 后 ), 且 油价 下 降 的 概 
率 为 0.9, 若 油价 升 高 , 获 400k $ ( 折 现 后 ) , 旦 油价 升 高 的 概率 为 0.1;(3) 投 资 200k $ 钻探 , 钻 
探 结果 出 现 干 并 ,低产 井 和 高 产 井 的 概率 值 和 纯 收 益 ( 折 现 后 ) 列 于 表 1 - 7 中 。 作 为 决策 者 ， 

si 








在 三 个 方案 中 ,您 如 何 选择 ? 
R1-7 例 1-7 中 的 有 关 数 据 




















井 类 型 | 概率 纯 收 益 
FH 0.50 -200k 
低产 0.40 | 200k 
高 产 | 0.10 1300 











解 :(1) 计 算 各 方案 的 期 望 货币 值 : 

(a) 立 即 卖 掉 区 块 勘探 开发 权 EMV = 125k $ ; 

(b) 一 年 后 卖 掉 其 勘探 开发 权 EMV =0.1x400k $ +0.9x 100k $ = 130k$ ; 

(c) 投 资 200k $ ,钻探 EMV =0.5x(-200k$)+0.4x200k$ +0.1 x 1300k $ = 110k $ > 

(2) 各 方案 期 望 货币 值 比较 : 

通过 比较 ,一 年 后 卖 掉 区 块 勘探 开发 权 具 有 最 大 的 期 望 货币 值 , 故 选择 一 年 后 卖 掉 区 块 勘 
探 开 发 权 。 

上 述 决策 过 程 可 利用 决策 树 ( 图 1 - 6) 清 晰 明了 地 图 示 出 来 。 
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图 1-6 决策 树 应 用 实例 分 析 


三 \ 基 于 期 望 效用 值 的 决策 方法 
上 面 根据 最 大 期 望 货币 值 进 行 的 决策 ,反映 的 是 图 1 - 5 中 的 直线 所 对 应 的 对 风险 具有 中 
性 态度 的 决策 者 所 做 的 决策 。 但 不 同 的 决策 者 对 待 风险 的 态度 是 不 同 的 ,不 同 的 人 有 不 同 的 
效用 曲线 , 恨 据 期 望 效用 值 决策 的 结果 也 是 不 同 的 (图 1- 7)。 
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图 1-7 基于 期 望 效用 值 的 决策 


在 图 1- 7 中 ,末梢 点 上 将 期 望 货币 值 用 期 望 货币 值 带 给 某 个 决策 者 的 期 望 效 用 值 来 取 
代 , 最 终 得 到 的 期 望 效用 值 表 明 ,选择 “钻探 "给 该 决策 者 带 来 最 大 的 期 望 效 用 值 ( 即 最 大 的 满 
足 度 ) , 故 按期 望 效 用 值 决策 方法 ,该 决策 者 会 选择 “钻探 "而 非 * 一 年 后 卖 掉 ”。 


四 、 贝 叶 斯 (Bayes) 决 策 方法 


当 一 些 新 的 信息 获得 后 ,决策 会 发 生变 化 ,如 何 把 新 的 信息 融入 "决策 过 程 ,是 贝 叶 斯 决 
策 方法 要 解决 的 问题 ,下 面 ,我们 用 实例 来 说 明 贝 叶 斯 决策 方法 。 

【 例 1-8】 在 例 1- 7 中 ,假定 还 存在 第 四 个 方案 , 即 在 钴 并 之 前 部 署 地 震 工作 量 以 进 一 
步 落实 地 质 构造 ,其 费用 为 10k $ ,地 震 工 作 量 的 结果 有 三 种 可 能 ,一 是 无 构造 ,二 是 构造 开 
启 ,三 是 构造 封闭 ,上 且 根 据 以 往 勘 探 的 经 验 ,不 同类 型 井 对 应 的 地 质 构造 情况 列 于 表 1 -8。 作 
为 决策 者 ,在 四 个 方案 中 ,您 如 何 选择 ? 


表 1-8 例 1-8 中 不 同 井 类 型 对 应 的 地 质 构造 情况 

















无 构造 | 构造 开启 构造 封闭 
并 0.70 | 0.20 0.10 
| me ow | 0.40 0.30 aj 
— „GE [| oo [R oo | œ% 














解 :(1) 首 先 ,在 做 地 震 工作 量 之 前 ,需要 知道 “无 构造 "“ 构 造 开启 "和 "构造 封闭 "出 现 的 
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概率 ,可 根据 表 1 - 7 和 表 1 - 8 提供 的 信息 ,用 图 1-8 的 概率 树 计算 出 这 些 概率 值 : 
P( 无 构造 ) = 0.48, P( 构 造 开启 ) = 0.29, P( 构 造 封闭 ) = 0.23 
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图 1-8 概率 树 的 应 用 
(2) 其 次 ,需要 知道 在 出 现 “无 构造 "“ 构 造 开启 "和 “构造 封闭 "不 同情 况 的 条 件 下 ,出 现 
“ 干 井 ”“ 低 产 井 "和 “高 产 井 "的 概率 ,这 些 概率 值 可 用 贝 叶 斯 公式 (1 - 8) 求 得 ,如 在 “无 构造 ” 
事件 出 现 的 情况 下 ,“ 干 井 " 事 件 出 现 的 概率 为 : 
P( 干 井 /无 构造 ) = P( 干 井 和 无 构造 同时 出 现 )/P( 无 构造 ) =0.35/0.48 = 0.73 
求 取 的 概率 值 表示 在 图 1 - 9 的 逆 概率 树 中 。 
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图 1-9 逆 概 率 树 的 应 用 
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(3) 根 据 以 上 信息 ,就 可 绘制 图 1 - 10 所 示 的 决策 树 , 该 图 表明 ,选择 “ 钴 井 之 前 部 署 地 震 
工作 量 " 将 得 到 最 大 的 期 望 货币 值 。 
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图 1- 10 贝 叶 斯 决策 树 


命 思 考 和 练习 题 驴 


1. 如 何 理解 和 区 分 两 个 事件 之 间 的 “不 相 容 性 "和 “独立 性 "? 在 两 个 事件 相 容 的 情况 下 ， 
概率 的 加 法 公式 应 如 何 写 ? 

2. 如 何 理解 条 件 概 率 公 式 ,概率 的 乘法 公式 和 全 概率 公式 ,并 从 这 些 公 式 出 发 ,推导 出 贝 
叶 斯 概率 公式 。 

3. 某 油层 中 有 三 种 沉积 微 相 , 已 知 其 中 第 ~. 第 二 和 第 三 种 沉积 微 相 各 占 总 量 的 50% 、 
25% 和 25% ,又 知 第 一 、 第 一 和 第 三 种 沉积 微 相 高 渗透 ( > 100 x 107 pm ) 岩 心 出 现 的 概率 分 别 
为 1%.2% 和 4% ,根据 例 1 - 6 的 计算 , 当 已 知 取 出 的 - -个 样品 为 高 渗透 率 样品 时 ,这 个 样品 
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属于 第 一 ,第 二 和 第 三 种 沉积 微 相 的 可 能 性 分 别 为 25% .25% 和 50% , 问 哪些 是 先 验 概率 ? 哪 
些 是 后 验 概率 ? 

4. 就 图 1 - 10 中 的 决策 , 若 考虑 您 个 人 的 效用 曲线 (自己 为 自己 构筑 此 曲线 ) ,您 的 最 终 决 
策 选 择 是 什么 ? 

5. 某 勘探 项 目 组 在 某 一 区 块 设计 了 4 口 井 的 勘探 方案 ,根据 经 济 评价 情况 ,4 口 井 中 至 少 
有 两 口 井 发 现 油气 ,这 一 方案 才 是 经 济 有 效 的 ,假定 钴 第 一 口 井 的 成 功率 为 0.1, 并 假定 在 每 
一 成 功 井 之 后 的 探 井 成 功 的 概率 增加 一 倍 , 问 这 个 勘探 方案 成 功 的 概率 有 多 大 ? 

6. 有 x 型 汽车 ,出 厂 时 次 品 占 30% 。 对 合格 的 车 , 某 试车 手 在 试车 后 ,有 80% 的 可 能 认为 
是 合格 车 ,20% 的 可 能 认为 是 次 品 车 ;对 不 合格 的 车 ,有 90% 的 可 能 认为 是 次 品 车 ,10% 的 可 能 
认为 是 合格 车 。 问 (1) 直 接 购买 得 到 次 品 车 的 可 能 性 为 多 大 ? (2) 经 试车 手 试车 后 认为 合格 再 
购买 的 情况 下 ,得 到 次 品 车 的 可 能 性 为 多 大 ? 
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第 二 章 ”随机 变量 和 统计 推断 


本 章 学 习 目 的 和 要 求 :本 章 介 绍 随机 变量 、 随 机 交 量 的 数字 特征 、 随 机 变量 的 分 
布 函 数 、 参 数 估计 和 假设 检验 及 其 在 油气 藏 地 质 参数 研究 中 的 应 用 ,要 求学 生 能 够 用 
这 些 基本 工具 解决 在 工作 中 过 到 的 相关 问题 。 学 习 本 章 内 容 ,需要 具备 第 一 章 中 概 
率 论 的 基本 知识 。 


第 一 节 ”随机 变量 及 其 数字 特征 


一 、 随 机 变量 


1. 随 机 变量 的 定义 

设 随机 试验 E 的 样本 空间 为 a = |w| ,2 = Z(w) 是 定义 在 O 上 的 单 实 值 函 数 ,而 且 对 任 
一 实数 >, 事件 1Z< z| 都 有 确定 的 概率 , 则 称 Z 是 一 个 随机 变量 , 记 为 2 = Z(w), 简 言 之 , 随 
机 变量 就 是 具有 一 定 概率 分 布 的 变量 。 

从 数学 的 角度 来 看 ,随机 变量 与 样本 空间 实际 上 是 一 个 对 应 关系 ,即将 样本 空间 中 每 一 个 
可 能 的 结果 与 一 个 实数 相对 应 (图 2- 1)。 
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图 2- 1 随机 变量 与 样本 的 对 应 关系 
[612-1] 设 一 个 盒 中 有 5 件 产品 ,其 中 3 件 为 正品 (标号 为 1.2 和 3),2 件 为 次 品 (标号 
为 4 和 5), 从 中 取出 3 件 ,观察 取出 的 3 件 产品 中 含 正 品 的 件数 , 含 正品 的 件数 即 为 一 随机 变 
量 Z( 表 2-1)。 
在 本 例 中 ,取出 的 三 件 产品 中 含 正品 的 件数 与 样本 空间 中 的 每 个 样本 一 一 对 应 , 且 对 任 一 
实数 >, 事 件 1Z< z| 都 有 确定 的 概率 ,如 P|Z<1} =0.3, 符 合 随机 变量 的 定义 , 故 Z 是 一 个 随 
机 变量 。 
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R2-1 随机 试验 的 样本 空间 及 其 对 应 的 随机 变量 




















w Z( 正 品 件数 ) w Z( 正 品 件数 ) 
(1,2,3) 3 (1,4,5) 1 
(1,2,4) 2 (2,3,4) 2 
(1,2,5) 2 (2,3,5) 2 
(1,3,4) 2 (2,4,5) 1 
(1,3,5) 2 (3,4,5) 1 











2. 随 机 变量 的 分 布 函数 和 密度 函数 
要 研究 随机 变量 Z ,首先 要 掌握 Z 在 各 个 范围 取 值 的 概率 ,为 此 ,我 们 引入 分 布 函数 的 概 
念 ,随机 变量 Z 的 分 布 函数 定义 为 
F(z) = PIZ < z} - © <z<+% (2-1) 
即 分 布 函数 是 事件 |Z< z| 发 生 的 概率 Po 
F(z) 具 有 如 下 基本 特征 (图 2-2): 
(1)0< F(z)<1; 
(2) lim F(z) =0; 
(3) lim F(z)=1; 
(4) F(z) 关 于 自 变量 z 单调 不 减 。 
注意 F(z) 实 质 上 是 累积 分 布 函数 ,简写 为 cdf。 
在 地 质 应 用 研究 中 ,常常 对 变量 值 大 于 某 一 给 定 值 发 生 的 概率 感 兴趣 , 即 用 到 “大 于 "概率 
分 布 函数 , 记 为 4F(z) 
AF(z) = PÍZ > z} = 1- F(z) (2-2) 
分 布 函数 F(z) 的 导数 ,为 随机 变量 Z 的 概率 密度 函数 ,简写 为 pdf( 图 2- 3), 即 
fla) = F(z) -四 <z<+m (2-3) 
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图 2-2 随机 变量 的 (累积 ) 分 布 函数 图 2-3 随机 变量 的 概率 密度 函数 
概率 密度 函数 /(z) 具 有 以 下 特点 : 
(1) lim /(2) =0; 
(2) lim/(2) =0; 
(3)7(z) 曲 线 与 = 轴 之 间 的 面积 为 1; 
(4) 某 一 = 值 左 侧 的 面积 等 于 (累积 ) 分 布 函数 F(z)。 
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3. 随 机 变量 的 数字 特征 

随机 变量 的 数字 特征 包括 期 望 值 TAA k ME 

随机 变量 Z 的 数学 期 望 值 是 Z 所 取 的 全 部 可 能 值 的 加 权 平均 值 ,是 刻画 随机 变量 Z 取 值 
平均 大 小 的 一 个 数字 特征 


E(Z) = p = 三 :ar g REGIE 2-4) 


随机 变量 Z 的 方差 是 刻画 随机 变量 Z 在 它 的 数学 期 望 周 围 取 值 分 散 或 集中 程度 的 一 个 
数 ,是 随机 变量 Z 的 另 一 个 数字 特征 


Var(Z) = ELZ - E(ZYE = [i _ pozdF(z) = f.e - m)?f(z)dz = a?(2 - 5) 
随机 变量 Z 的 方差 ,也 可 展开 成 以 下 形式 


Var(Z) = E[Z - E(Z)J = E(Z*) - E(ZY = ò (2-6) 
随机 变量 Z 的 上 MIRRE FRE 
E(Z) = [| aF) = f” foa (2-7) 


式 中 ,为 正 整数 。 显 然 ,随机 变量 Z 的 1 阶 原 点 矩 即 为 随机 变量 Z 的 期 望 值 。 
随机 变量 Z 的 大 阶 中 心 矩 由 下 式 定义 


ELZ - E(ZY): = [lz - E(ZYJ'AFG) = [7 lz- ECZYJYCZ)dŁ (2-8) 
式 中 ,为 正 整 数 。 显 然 ,随机 变量 Z 的 2 阶 中 心 矩 即 为 随机 变量 Z 的 方差 。 
Z. n 维 随机 向 量 
1.n 维 随机 向 量 的 定义 和 协 方差 函数 
在 实际 问题 中 ,常常 需要 研究 多 个 随机 变量 之 间 的 关系 ,这 就 要 借助 于 随机 向 量 。n 维 随 
机 向 量 是 由 个 随机 变量 组 成 的 变量 组 , 记 为 | 2,, Za, Z, to 
n 维 联合 分 布 反 映 变 量 之 间 的 相互 关系 


F(zy,żą,***,2,) = PIZ & 31,2 ge zz (2 - 9a) 
n 维 联合 分 布 的 概率 密度 函数 定义 为 
人 (2 - 9b) 


任意 两 个 变量 之 间 的 协 方差 函数 定义 为 
Cw(Z,,Z,) = El[Z - E(Z,)JLZ,. - E(Z,.)]! = E(ZZ,) - E(Z)E(Z,.) 
= 0, (2 - 10) 
协 方差 函数 反映 两 个 变量 之 间 的 相关 性 ,Cov( Z, , Z.) >0, 变 量 Z,Z.(jzj) 正 相关 ,Cov 
(如 ,名 )<0; 变 量 如, 如 .(j 埃 六 ) 负 相关 ;Cov( 肥 ,2.)=0, 变 量 Z, Z Gj) RHA. 
任意 两 个 随机 变量 之 间 的 相关 系数 定义 为 
y, DZ) 
35 O J VarlZ,) Var(Z,) 
相关 系数 也 反映 两 个 变量 之 间 的 相关 性 , 且 消 除了 量 岗 , - 1< 7zz <l, | Vzz | 越 大 , 相 
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Gær) (2-11) 





【 例 2-2】 在 例 2- 1 中 ,同时 考虑 所 取 3 件 产品 中 的 正品 件数 和 所 取 3 件 产品 的 编号 之 
和 , 即 构成 2 维 随机 向 量 1 Z,, Z:|( 表 2- 2)。 试 求 Z,, Z, 的 联合 分 布 . 协 方差 及 相关 系数 , 判 
别 这 两 个 变量 的 相关 性 。 


表 2-2 随机 试验 的 样本 空间 及 其 对 应 的 二 维 随机 向 量 |Z, , Z) 









































了 | z Z, T Z, A 
L (正品 件数 ) (编号 之 和 ) | : 《正品 件数 ) (编号 之 和 ) 
az» | 3 6 0,4,5) 1 10 
aza | 2 7 (2.3.4) 2 9 | 
| a25 | 2 8 eas | 2 10 
(1,3,4) | 2 DRA 4 | 1 SR 
| (1,3,5) | 2 9 l (3,4,5) 1 12 
a 1=1,2,3 a 
解 :可 计算 概率 值 P12, = 1,Z, = Li Pole | ,得 (Z,,Z,) 的 联合 概率 密度 以 及 边 


缘 概率 密度 , 列 于 表 2-3 中 。 
表 2-3 Z, Mz, 两 个 随机 变量 的 联合 概率 密度 及 边缘 概率 密度 
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要 计算 协 方差 函数 , 需 先 计算 随机 变量 Z, A Z, 的 数学 期 望 和 方差 


3 n, 
E(Z,) = PIZA =ll=1.8  E(Z,) = MPI Z =k|=9 


Var( Z,) = ELZ, - E(Z,)) = 0.36 
Var(Z,) = E[Z, - EQ 
则 协 方差 函数 为 :Cov(Z, „ Z,) = E![ Z, - ECZ,)]LZ, - E(Z,)]| = -0.9 
Cov( Z, , Z2) -0.9 
相关 消 数 为 : yz z, = /Ve Vt ="70%6x3 
从 协 方差 函数 取 负 值 来 判断 ,随机 变量 Z, 和 Z, 之 间 呈 负 相 关 关 系 ,从 相关 函数 的 取 值 
来 判断 ,随机 变 基 Z, 和 Z, ŻA BECKY GUADEJEK = 
.n 维 随 机 向 量 的 物理 含义 
n 维 随 机 向 量 可 以 有 3 种 理解 :(1) 不 同属 性 的 变量 在 同一 点 上 ;(2) 同一 属性 的 变量 
在 不 同 点 上 ;(3) 不 同属 性 的 变量 在 不 同 点 上 。 
若 按 第 一 种 含义 去 理解 ,不 涉及 空间 问题 ,只 涉及 多 个 变量 之 间 的 关系 问题 , 属 多 元 统计 
学 研究 的 范畴 ,多 元 统计 学 方法 将 在 第 三 章 后 半 部 分 和 第 四 章 介绍 。 
若 按 第 二 种 理解 , 则 n 维 随机 向 量 就 是 一 个 随机 函数 , 记 为 Z(x),Z(x) 可 称 作 空 间或 时 
间 上 相关 的 一 组 随机 变量 ,x 为 空间 位 置 ,也 可 理解 为 所 有 空间 的 集合 。 随 机 函数 在 一 维 时 间 
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= - 0.274 





EMO 








轴 上 , 称 随机 过 程 ,在 二 维 或 三 维 空间 轴 上 称 随机 场 , 若 把 时 间 和 空间 问题 结合 起 来 ,就 构成 一 
个 时 空 模型 。 电 场 \ 磁 场 ,重力 场 和 温度 场 等 都 是 空间 点 的 函数 , 且 它 们 也 都 有 随机 性 的 变化 ， 
故 都 可 看 成 随机 场 。 对 它们 每 次 随机 观测 的 结果 ,都 得 到 一 个 确定 的 空间 点 函数 (或 实现 ), 而 
当 我 们 对 空间 固定 的 某 点 xo 来 考察 它们 时 , 则 得 到 一 个 随机 变量 Z(xo)。 随 机 函数 及 其 在 地 
质量 变 研究 中 的 应 用 ,将 在 第 五 章 至 第 七 章 讨论 。 

若 按 第 三 种 理解 , 则 n 维 随机 向 量 为 多 元 区 域 化 变量 和 多 元 地 质 统计 学 研究 的 对 象 ,多 
元 地 质 统计 学 超出 本 教材 讨论 的 范围 ,有 兴趣 的 读者 可 参考 有 关 文献 。 


第 二 节 常见 的 概率 分 布 函数 


一 、 正 态 分 布 


正 态 分 布 的 概率 密度 函数 为 钟 形 (对 称 ) 曲 线 。 正 态 分 布 有 两 个 参数 , 即 随机 变量 的 期 望 
W u 和 方差 s*。 若 随机 变量 Z 服从 正 态 分 布 ,可 记 为 2 ~ N(j,o*)。 期 望 值 w 为 曲线 的 最 高 
点 对 应 的 横 坐 标 值 。 方 差 o? 反映 随机 变量 的 离散 程度 ,o? 越 小 ,曲线 就 越 瘦 , 随机 变量 的 分 
布 就 越 集中 ;o? 越 大 ,随机 变量 的 分 布 越 离散 ,概率 密度 函数 曲线 就 越 胖 。 图 2 - 4 中 的 曲线 
为 x =0 和 o 分别 取 不 同 值 的 三 个 正 态 分 布 的 概率 密度 曲线 (o? < 02 < 03) o 

在 油气 资源 评价 中 , 正 态 分 布 随机 变量 起 了 十 分 重要 的 作用 ,孔隙 度 有 效 油层 厚度 等 党 
呈正 态 分 布 形式 。 

正 态 分 布 的 密度 函数 为 


M2) = zzl- 4(=)] (2 - 12) 
式 中 “一 随机 变量 Z 的 期 望 值 ; 
0 一 一 随机 变量 Z 的 均 方差 。 
正 态 分 布 的 累积 分 布 函数 为 
FD = | zel - 7(-57) Jee (2- 13) 
式 (2- 12)", 4 n=0,0* =1 时 ,得 到 标准 正 态 分 布 [ 记 为 2 ~ N(0,1)] 的 密度 函数 


fa) = zl- +) (2 - 14) 
标准 正 态 分 布 的 (累积 ) 分 布 函 数 为 
: i 
FG) = Zl - 5|d (2 - 15) 


从 标准 正 态 分 布 表 ( 附 表 1) 中 读 出 的 对 应 z 值 的 数值 ,实际 上 是 F(z) 值 或 者 说 是 z 值 左 
侧 概率 密度 曲线 的 面积 (图 2- 5), 即 事件 !Z < z| 发 生 的 概率 值 。 
借助 于 标准 正 态 分 布 表 ,我 们 可 以 非常 方便 地 解决 有 关 的 概率 求解 问题 ,对 任 一 服从 正 分 
布 态 的 变量 2 ~ N(jp,o"), 可 通过 以 下 变换 
7 z=E (2 - 16) 
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图 2- 4 止 态 分 布 曲 线 图 2 -5 标准 正 态 分 布 表 中 的 数值 对 应 于 z (A 
左 侧 的 面积 
变 为 标准 正 态 分 布 的 变量 Z ~ N(0,1) ,也 就 可 以 借助 于 标准 正 态 分 布 表 非 常 方便 地 解决 有 


关 的 概率 求解 问题 了 。 

【 例 2-3】 某 油层 有 大 量 的 岩心 孔隙 度 资料 ,根据 对 这 些 资 料 的 分 析 发 现 , 孔 蛛 度 值 服 
从 正 态 分 布 ,数学 期 望 = 10, 方 差 o” =9。 现 要 打 一 口 新 井 , 问 (1) 获 得 该 油层 岩心 孔隙 度 大 
于 15% 的 概率 有 多 大 ? (2)60% 的 可 能 取 到 小 于 某 一 孔隙 度 值 的 岩心 ,这 一 孔隙 度 值 是 多 大 ? 

解 :(1) 获 得 该 油层 岩心 孔隙 度 大 于 15% 的 概率 是 事件 | Z > 15% | 发生 的 概率 , 即 

PlZ > 15%! = 1- PIZ < 15%] = 1- F(15) 
现在 来 求 F(15) ,首先 用 式 (2 - 16) 的 变换 把 正 态 分 布 变量 Z ~ N(10,9) 转 化 标准 正 态 分 
布 变量 Z! ~ N(0,1) ,对 应 于 z = 15, 得 到 z = 1.67, 从 标准 正 态 分 布 表 中 可 读 出 
F(15) = PIZ <15} = PIZ' <1.67| = F(1.67) = 0.9525, 故 有 
P(Z > 15%| = 1- PIZ < 15%| = 1- F(15) = 0.0475 
(2) 在 标准 正 态 分 布 表 中 读 出 60% 概 率 对 应 的 z' =0.25, 故 对 应 的 孔隙 度 值 = p + 
gz' = 10% +3% x0.25=10.75%。 


二 、 对 数 正 态 分 布 Jee 


当 某 一 随机 变量 的 对 数值 服从 正 态 分 布 时 , 则 | 
该 变量 服从 对 数 正 态 分 布 ,在 油气 勘探 评价 中 ,对 | 
数 正 态 分 布 得 到 了 广泛 的 应 用 ,如 渗透 率 、 油 层 厚 
度 ,采油 率 、 储 量 和 油田 规模 等 常 属于 这 种 分 布 。 to £ 
对 数 正 态 分 布 是 一 连续 型 概率 分 布 , 概 率 密 
度 曲线 呈 非 对 称 右 偏 (图 2 - 6) ,概率 密度 为 


l= (z > 0) 
fa) = [9% (2 - 17) 


0 (z <0) 





图 2-6 对 数 正 态 分 布 曲线 





式 中 ,w = E(lnZ) „o? = Var(InZ)。 
三 \ 三 角 分 布 


当 原 始 数据 只 有 最 小 值 a、 最 大 值 和 介 于 二 者 之 间 的 最 佳 值 5 旦 不 知道 随机 变量 的 分 
布 概 型 时 ,一般 采用 三 角 分 布 函数 。 三 角 分 布 是 一 种 三 角形 的 连续 分 布 (图 2 - 7) ,三 角 分 布 的 
概率 密度 为 
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fa) =1 2c-2) (2 - 18) 
Tez aj(c-b) LA 
0 其 他 
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图 2-7 三 角 分 布 图 


四 、 均 匀 分 布 


当 随机 变量 的 数据 只 有 最 小 值 和 最 大 值 4, 一 般 采用 最 简单 的 均匀 分 布 来 代替 随机 变 
莉 的 分 布 函数 。 均 匀 分 布 是 描述 随机 变量 的 每 一 个 数值 在 某 一 区 间 [ a, 5] 内 等 可 能 发 生 的 连 
续 型 概率 分 布 , 其 概率 密度 为 


is a<z<b 


f=) = -a (2 - 19) 
0 za 或 :>b 


第 三 节 ”抽样 及 样本 统计 量 的 分 布 


一 \ 总 体 ,样本 及 样本 统计 量 


1. 总 体 (母体 ) 

服从 某 一 定义 的 所 有 个 体 的 集合 称 为 总 体 (母体 ) ,在 数理 统计 中 , 称 随机 变量 或 其 概率 分 
布 为 总 体 , 记 为 2。 总 体 可 以 是 有 限 总 体 (如 某 年 级 某 班 所 有 的 学 生 ) ,也 可 以 是 无 限 总 体 ( 如 
某 油 层 的 孔隙 度 )。 

2. 样 本 ( 子 样 ) 

为 了 研究 总 体 的 性 质 , 乍 看 起 来 ,最 好 是 把 每 个 个 体 的 要 研究 的 性 质 都 加 以 测定 。 但 这 往 
往 是 不 必要 的 ,有 时 甚至 是 不 可 能 的 。 我 们 常常 从 总 体 中 抽取 n 个 个 体 进行 观测 ,然后 就 根 
据 这 ”个 观测 值 去 推断 总 体 的 性 质 ,由 n 个 个 体 构成 的 集合 称 为 样本 ( 子 样 ) ,mn 小 于 总 体 所 
包含 的 个 体 数 ,n 称 为 样本 容量 。 样 本 是 通过 抽样 获得 的 ,抽样 的 目的 是 通过 获得 的 样本 对 总 
体 的 特征 进行 统计 推断 。 要 使 这 种 推断 是 合理 的 ,首先 就 要 求 抽样 过 程 是 随机 的 ,是 经 过 精心 
设计 的 。 如 要 研究 某 油层 的 孔隙 度 ,就 要 尽量 使 样本 的 个 体 在 空间 上 均匀 分 布 ,否则 ,得 到 的 
样本 就 不 具有 代表 性 。 

3. 样 本 分 布 函 数 (经 验 分 布 函数 ) 和 频率 直方 图 


母体 Z 的 分 布 函数 F(z) 往 往 是 未 知 的 ,如 何 根据 来 自 母 体 Z 的 一 个 样本 去 估计 F(z) 
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呢 ? 我 们 可 以 这 么 办 ,将 具体 观测 到 的 结果 ( 即 样本 观测 值 )z, , >: ,…,= ,…, z, 按 大 小 顺序 排 
Rzy sza zz <…<z; ,定义 函数 


0 z<: 
Fa) =p a gagao nl) (2 - 20) 
1 e E e 
其 图 形 如 下 
~ 





图 2-8 样本 (累积 ) 分 布 函数 
显然 ,对 给 定 的 样本 观测 值 z, ,…, z, (从 而 也 就 给 定 了 zr szi ,…,z ) 来 说 , FF,(z) 作 为 z 
的 星 数 ,是 一 个 不 降 、 左 连续 函数 , 且 F,(- %)=0,F,(+©)=1. ik F(z) 是 一 个 概率 分 布 
函数 , 称 其 为 样本 分 布 函数 (或 经 验 分 布 函数 )。 
而 对 每 一 个 给 定 的 z 来 说 ,F(z) 是 在 对 Z 的 n 次 独立 观测 中 ,小 于 或 等 于 z 的 观测 值 出 
现 的 频率 , 亦 即 事件 |Z < zl 出 现 的 频率 , 它 是 一 个 随机 变量 。 根 据 贝 努 里 大 数 定律 可 知已 (z) 
依 概率 收敛 到 事件 1Z < z| 的 概率 , 即 F, (2) >F) Cne) Akk, 4 n 充分 大 时 ,样本 函 
数 扩 (z) 是 母体 分 布 函数 F(z) 的 良好 近似 。 这 正 是 人 们 常用 F(z) 去 估计 F(z) 的 原因 。 图 
2-9 是 根据 100 个 灯泡 的 使 用 寿命 所 画 出 的 样本 分 布 函数 Fiw(z) 及 其 相应 的 母体 分 布 函数 
F(z)。 其 中 阶梯 形 函 数 为 Pm(z)。 这 里 n = 100 比较 大 ,由 图 形 可 以 大 致 看 出 , Rw (z) 是 
P(z) 的 良好 近似 。 





图 2-9 根据 100 个 灯泡 的 使 用 寿命 所 画 出 的 样本 分 布 函 数 Fio Cz) 
及 其 相应 的 母体 分 布 消 数 F(z) 

构造 样本 分 布 函数 ,无 论 是 连续 型 随机 变量 还 是 离散 型 随机 变量 都 是 可 以 的 。 但 对 连续 
型 母体 Z 来 说 ,人 们 常用 频率 直方 图 去 给 出 母体 Z 的 分 布 密 度 f(z) 的 良好 近似 。 

如 前 ,将 对 Z 的 n 次 独立 观测 值 x ,z,,…, 2, 依 大 小 顺序 排 成 zi <a; <… <z; , 取 略 小 
于 zj 的 数 a 及 略 大 于 z:; 的 数 5 ,并 在 区 间 (a,b] 中 插入 一 些 分 点 a= to < ti << tni < in 
= 站 ,将 区 间 (e,b] 划 分 成 严 个 左 开 右 闭 的 小 区 间 。 实 践 中 通常 取 分 点 为 等 分 点 , 且 使 落 人 每 
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个 小 区 间 内 的 点 不 少 于 5 个 (否则 ,可 将 相 邻 的 若干 小 区 间 加 以 
| 合并 ,使 每 个 小 区 间 内 的 数据 不 少 于 5 个 。 当 然 , 这 样 分 点 就 不 
| m 一 定 是 等 分 点 了 ,但 这 也 无 妨 )。 我 们 以 v, 表示 落 入 第 i 个 小 区 
| 











间 (4.1,4] 内 的 观测 值 的 个 数 一 称 为 频数 , 则 vi/n = /, 就 是 
H 观测 数据 中 落 人 第 i 个 小 区 间 内 的 频率 。 在 直角 坐标 系 内 ,以 
E 各 个 小 区 间 为 底 , 画 一 竖 着 的 长 方形 ,使 第 i 个 长 方形 的 面积 为 
wh 311m 一 所 ,通常 称 这 样 的 图 形 为 频率 直方 图 ,简称 为 直方 图 ( 见 图 

2-10)。 

图 2- 10 频率 直方 图 由 大 数 定律 知 ,f; 作为 母体 Z 的 观测 值 落 入 第 ; 个 小 区 间 
《51b] 内 的 频率 ,应 近似 于 (在 依 概率 收敛 的 意义 下 ) Z 落 入 第 ;个 小 区 间 内 的 概率 , 即 应 
fi: 




















f= Plia Zg) = f Kajdz (2 - 21) 


若 Z 的 概率 密度 f(z) 在 (4;-, t AER, 


[| Ad: = KM, (2 - 2) 


其 中 ,z 是 (4-,,4] 内 的 任意 一 点 ,At; = t- 41。 

BATI fi =fC2)AL, „BB f/AŁ =f(z)。 由 此 可 见 ,频率 直方 图 的 上 部 轮廓 线 一 一 折线 , 确 是 
密度 函数 /( :) 的 良好 近似 。 

4. 样 本 统计 量 


2-15; 2-23) 


和 样本 方差 





ts- Pia- 2-24) 
2 


都 是 样本 统计 量 , 还 有 样本 的 上 阶 原 点 矩 和 上 阶 中 心 矩 也 是 样本 的 统计 量 ,这 些 样本 的 统计 重 
统称 为 样本 的 数字 特征 。 


二 ,样本 统计 量 的 分 布 和 中 心 极限 定理 


要 根据 样本 对 总 体 的 性 质 进行 统计 推断 ,还 必须 了 解 样本 统计 量 的 分 布 特征 ,这 里 主要 讨 
论 样本 均值 的 分 布 特征 。 

假如 从 总 体 中 随机 抽取 若干 个 容量 为 n 的 样本 ,对 每 个 样本 都 可 以 计算 均值 ,这 些 均值 
的 分 布 即 为 样本 均值 的 分 布 ,下 面 ,我 们 通过 一 个 简单 的 算 例 引出 一 个 重要 的 定理 一 一 中 心 极 
限定 理 。 

【 例 2-4】 设 某 一 随机 变量 Z( 总 体 ) 包 含 5 个 个 体 (样本 点 ) ,其 变量 值 ,期 望 值 和 方差 列 
于 表 2 -4 中 ,随机 抽取 容量 为 2 的 样本 ,考察 样本 均值 的 分 布 。 

+ 30 > 





表 2-4 随机 变量 Z{ 总 体 ) 的 取 值 .期 望 值 和 方差 


























序号 Z (BUM Z 的 期 望 值 Z 的 方差 
1 | 332 | 
2 336 
1$ LŚ 
3 340 = == = = = - = 
u = E(Z) ED 340 | Var(Z) = o? s 340)? = 32 
4 34 
5 348 E 








样本 统计 量 列 于 表 2- 5 中。 


解 :随机 抽取 容量 为 2 的 样本 ( 放 回 抽样 ) ,可 能 抽 到 的 样本 点 的 组 合 \ 变 量 值 \ 样 本 均值 及 


表 2-5 样本 点 的 组 合 、 变 量 值 .样本 均值 及 样本 均值 统计 量 































































































wars | 。 样本 点 组 合 | 。 变量 值 组 合 | Wim) 样本 均值 统计 量 
1 (1,1) (332,332) 332 
2 (1,2) (332,336) 334 
3 (1,3) (332,340) | 336 
4 (1,4) (332,34) | 338 | 
5 (1,5) (332,348) 340 
6 (2,1) (336,332) 334 
Æ ji (2,2) (336,336) 336 
8 (2,3) (336,340) 338 
9 (2,4) (336,34) 340 
[ 10 (2,5) (336,348) 342 样本 均值 的 期 望 什 
u (3,1) (340,332) | 336 (2) = 1 Sz zs 
12 (3,2) (340,336) 338 25 247% 
B (3,3) (340,340) 340 Sai 
| u 3,4) (340,34) m Ww(Z) = 35 ŻAL, - E(Ż)) 
15 (3,5) (340,348) 344 16a 2 
16 (4,1) (344,332) 338 
17 (4,2) (34,336) | 340 
18 (4,3) (344,340) 342 
19 (4,4) (344 ,344) 344 
20 (4,5) (344,348) 346 
21 (5,1) (348,332) 340 
2 (5,2) (348,336) 342 
3 (5,3) (348,340) m 
| x (5,4) (48,344) 346 
25 (5,5) (348,348) 348 | 








对 比 表 2-5 和 表 2-4 我 们 发 现 ,样本 均值 的 期 望 值 正 好 等 于 变量 (总 体 ) 的 期 望 值 ,样本 
均值 的 方差 正好 等 于 变量 (总 体 ) 的 方差 除 以 样本 容量 。 对 比 样本 均值 的 概率 密度 函数 和 变量 
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Fr JL 1 | E 


332 336 340 34 348 332 336 340 344 348 
(a) 随机 变量 (总 体 ) 的 概率 密度 (b) 样本 均值 的 概率 密度 





图 2- 11 随机 变量 (总 体 ) 和 样本 均值 概率 密度 函数 对 比 
的 概率 密度 函数 , 见 图 2 - 11(a)、(b) ,我 们 发 现 样 本 均值 的 概率 密度 函数 趋 于 对 称 。 这 些 现 
象 的 出 现 不 是 巧合 ,而 是 背后 的 定理 发 挥 “操控 "作用 的 结果 ,这 一 定理 就 是 著名 的 中 心 极限 定 
理 。 
中 心 极限 定理 可 表述 为 :从 期 望 值 为 /方差 为 的 随机 变量 (总 体 ) 中 随机 地 抽取 容量 
2 
为 n 的 样本 ,该 样本 的 均值 Z 为 一 随机 变量 ,该 随机 变量 趋向 于 服从 期 望 值 为 人 方差 为 二 的 


正 态 分 布 , 即 
E(Z) = p4 


Var(Ż) = £ RER) 


且 这 种 趋势 随 n 的 增 大 而 愈加 明显 。 
根据 具体 的 应 用 条 件 ,可 分 为 3 种 情况 : 
(1) 总 体 服从 正太 分布 , 且 o? 已 知 


hj Z 二 示 
sent, STE 服从 标准 正 态 分 布 


(2) 总 体 服从 任意 分 布 ,a? 未 知 ,n>30 





Šla- Z? 
此 时 ， ŽE 近似 服从 标准 正 态 分 布 ,其 中 ,= 守 zk 为 样本 均 方差 。 
(3) 总 体 服从 正太 分布,o? 未 知 ,n <30 


此 时 ,中 心 极 限定 理 已 不 适应 ， Z 服从 自由 度 为 (mn - 1) 的 Student 分 布 (又 称 t 577, 
n 


Èl -ZY 
AMB 2) ,其 中 ,s = 全 下 一 一 为 样本 均 方差 。 


【 例 2- 5】 某 油层 100 块 岩心 孔隙 度 (总 体 ) 的 统计 资料 表明 ,岩心 孔隙 度 (总 体 ) 服 从 正 
态 分 布 ,数学 期 望 y =12, 7% 0 = 16。 从 这 100 个 岩心 孔隙 度 (总 体 ) 数 据 中 随机 抽取 25 个 
岩心 孔 际 度数 据 作为 一 个 样本 , 问 该 样本 均值 有 多 大 的 概率 落 在 [10,15] 这 一 区 间 内 ? 


解 :根据 中 心 极限 定理 ,样本 均值 3 服从 正 态 分 布 ， zk 服从 标准 正 态 分 布 ,由 Z = 10 


和 =15 可 计算 出 二 的 值 分 别 为 -2.5 和 3.75, 则 标准 正 态 变量 Z 落 在 [ - 2.5， 
olVn olVn 
3.75] 区 间 内 的 概率 可 由 标准 正 态 分 布 的 分 布 表 查 得 ( 附 表 1) 
RA 











ania hj al/n on 


piżzk <3-75} [2 EE <2.5)-1 
= 0.99991 + 0.99379 — 1 
= 0.9937 

以 上 计算 过 程 可 参考 图 2- 12, 


Qa) 





LLA 
0 


2.5 3.75 z 


图 2- 12 从 标准 正 态 分 布 表 读 取 概率 值 示意 图 


第 四 节 统计 推断 


统计 推断 是 根据 样本 统计 量 及 其 分 布 特征 对 总 体 进行 研究 的 方法 ,包括 参数 估计 、 假 设 检 
验 和 方差 分 析 等 ,本 节 主要 讨论 参数 估计 和 假设 检验 方法 ,方差 分 析 在 讨论 回归 分 析 和 趋势 分 
析 具 体 应 用 时 在 相应 的 内 容 中 讨论 。 


一 、 参 数 估计 


1 .点 估计 
当 总 体 的 某 个 参数 是 根据 样本 观测 值 用 单一 的 数值 来 估计 时 , 称 为 点 估计 。 如 式 (1- 23) 
是 总 体 期 望 值 y 的 无 偏 估 计 , 式 (1 - 24) 是 总 体 方差 o” 的 无 偏 估计 。 点 估计 比较 简单 ,我 们 不 
多 讨论 。 
2. 区 间 估 计 
区 间 估 计 给 出 在 一 定 置信 水 平 1 - ala 为 壮 信 度 ) 下 总 体 某 个 参数 出 现 的 区 间 范 围 ,如 对 
总 体 期 望 值 x 有 如 下 区 间 估 计 
PiZ-Ksn<Z+K|=l-a (2 - 26) 
要 求 得 式 (2- 26) 中 的 天 ,我 们 先 讨论 ER 服从 标准 正 态 分 布 的 情形 ,从 标准 正 态 分 布 
表 ( 附 表 1) 中 可 读 出 式 
pf- za < ZE £żn|=l-a (2-20) 
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中 的 -zn 和 zn( 图 2-13)。 


Ja) 





图 2-13 在 1-a 置信 水 平 下 从 标准 正 态 分 布 表 中 读 取 - ze 和 xn 示意 图 
式 (2 -27) 经 过 变换 后 可 得 
P{2- za < p < Z + an} = 1-0 (2 - 28) 
对 比 式 (2 - 26) 和 式 (2- 28) ,可 得 天 = taj FÆ EO a) 置信 水 平 下 总 体 期望 值 y 的 
n 


区 间 估 计 为 
Z-iimsuSZ+ [zn (2 - 29) 


z Sla- ZY 
4 ŻA (其 中 , s = | FE — ) 近 似 服从 标准 正 态 分 布 时 ,在 (1 - “) 置 信 水 平 下 


总 体 期 望 值 y 的 区 间 估计 为 
Z-imęsuSŻ+ia (2 - 30) 


a NG - ŻY 
4 ŻE (th, s = „| 于- 一 一 ) 服 从 自由 度 为 (n - 1) 的 Student 分 布 时 ,在 (1- a) 
SAV n-l 


置信 水 平 下 总 体 期 望 值 y 的 区 间 估 计 为 
Z- teann E <su<Ž+ haa- JE (2 - 31) 
式 中 的 - ta(n- AI ton(n -1) 可 从 Student 分 布 表 ( 附 表 2) 中 读 取 。 
【 例 2- 6】 在 某 油层 中 取 36 块 岩心 作为 样本 , 测 得 其 孔隙 度 , 得 到 样本 均值 2 = 10, 样 本 方差 
Na, - ŻY 
= it =1 


解 :根据 中 心 极限 定理 ， zk 服从 标准 正 态 分 布 , 故 该 油层 孔隙 度 (总 体 ) 的 期 望 值 的 置 


信 区 间 可 用 公式 Z - asus + za R EES R Zan = Zous = 1.96, 4È 


和 人 题 中 给 定 的 样本 均值 和 样本 方差 得 9.02< y <10.98。 故 在 95% 的 置信 水 平 下 该 油层 孔隙 
.34 . 





= 9 , 问 在 %5% 的 置信 水 平 下 ,该 油层 孔隙 度 (总 体 ) 的 期 望 值 落 在 哪个 区 间 内 ? 





度 (总 体 ) 的 期 望 值 落 在 [9.02,10.98] 这 一 范围 内 。 
二 ,假设 检验 


1. 正 态 分 布 总 体 期 望 值 的 假设 检验 

假设 检验 是 除 参数 估计 之 外 的 另 一 类 重要 的 统计 推断 问题 ,我 们 把 任 一 关于 总 体 分 布 的 
假设 ,统称 为 统计 假设 ,简称 假设 。 我 们 用 关于 正 态 分 布 总 体 期 望 值 假设 检验 这 一 简单 的 情 
况 , 来 说 明 假设 检验 的 基本 原理 ,在 后 面 涉 及 的 更 复杂 情况 下 的 假设 检验 ,其 原理 是 相同 的 。 

1) 假设 检验 问题 

关于 正 态 分 布 总 体 期 望 值 的 假设 检验 问题 是 这 样 的 : 设 有 一 个 正 态 分 布 总 体 ,其 期 望 值 为 
po, E po 已 知 ,方差 为 ,方差 已 知 或 未 知 ,我 们 先 讨论 最 简单 的 情况 , 即 假定 方差 a? BA, 
现在 ,我 们 有 一 个 容量 为 n 的 样本 ,样本 的 均值 为 了 ,试问 该 样本 是 否 能 代表 该 总 体 或 者 说 该 
样本 是 否 来 自 于 该 总 体 ? 

回答 上 述 问 题 ,实际 上 是 要 回答 样本 的 均值 2 与 总 体 的 期 望 值 yo 是否 足够 接近 的 问题 ， 
或 者 说 样本 所 代表 的 真实 总 体 的 期 望 值 p 与 已 知 正 态 分 布 总 体 的 期 望 值 jo 是否 相 等 的 问题 ， 
即 确定 是 否定 还 是 接受 原 假设 (或 称 为 零 假设 ) 

Ho : p = po 
当 原 假设 被 否定 时 , 则 接受 对 立 假设 (或 称 为 备 择 假设 ) 
H, : p # po 3È H, : p > po 或 :p< po 

原 假设 和 备 择 假 设 是 相互 对 立 的 ,两 者 有 上 且 只 有 一 个 正确 。 所 谓 假设 检验 问题 ,就 是 要 判 
断 原 假设 Ho 是 否 正确 ,决定 拒绝 还 是 接受 诛 假设 , 若 拒绝 原 假设 就 接受 备 择 假设 。 

根据 备 择 假设 H 的 不 同 表述 ,我 们 可 以 把 假设 检验 分 为 双边 假设 检验 , 右 单 边 假设 检验 
和 左 单 边 假设 检验 三 类 ,下 面 ,我 们 以 双边 假设 检验 为 例 ,讨论 假设 检验 的 规则 。 

2) 假 设 检验 规则 

若 原 假设 Ho: e = po 为 真 , 则 | Z - pol) 一 般 应 较 小 ;否则 ，| Z - pol 一 般 应 较 大 。 因 
此 ,我 们 可 以 根据 |Z- po] 的 大 小 , 即 差异 是 否 显著 来 决定 拒绝 还 是 接受 原 假设 。 
|Z - | 愈 大 ,我 们 愈 倾向 于 拒绝 原 假设 。 那 么 | Z - yxo | 大 到 何 种 程度 才能 决定 拒绝 原 假 
设 呢 ? 为 此 ,需要 制定 一 个 检验 规则 : 

MIZ- po 1> C 时 ,拒绝 原 假设 Ho; 

当 12 - jo |< C 时 ,接受 原 假设 Hoo 
其 中 ,C 是 一 个 待定 的 常数 , 称 为 临界 值 。 我 们 把 拒绝 原 假设 H 的 范围 称 为 拒绝 域 ,接受 原 
假设 Ho 的 范围 称 为 接受 域 。 因 此 ,确定 一 个 检验 规则 ,事实 上 就 是 确定 一 个 拒绝 域 (或 接受 
域 ) 。 怎 样 确定 拒绝 域 ,这 涉及 假设 检验 中 的 两 类 错误 问题 。 

由 于 样本 具有 随机 性 ,根据 样本 做 出 判断 就 可 能 犯 两 类 错误 : 

一 类 错误 是 原 假设 本 来 正确 ,但 按 检验 规则 却 拒绝 了 原 假设 ,这 类 错误 称 为 弃 真 错误 或 第 
I 类 错误 ,其 发 生 的 概率 记 为 = ,也 就 是 说 在 原 假设 正确 的 情况 下 ,由 于 样本 的 随机 性 引起 的 
SHE Z - pl > C1 出 现 的 概率 为 a, 即 


PllZ-pyol>Cl=a (2 - 32) 
« 35 . 





另 一 类 错误 是 原 假 设 本 来 不 正确 ,但 按 检 验 规则 却 接受 了 原 假设 ,这 类 错误 称 为 取 伪 错 误 
或 第 下 类 错误 ,其 发 生 的 概率 记 为 8, 也 就 是 说 在 原 假设 本 来 不 正确 的 情况 下 ,由 于 样本 的 随 
机 性 引起 的 事件 112 - pol < C1 出 现 的 概率 为 8, 即 


PIIZ-mlzC|=B (2 - 33) 
检验 决策 和 两 类 错误 的 关系 如 表 2-6 所 示 。 
表 2-6 检验 决策 和 两 类 错误 的 关系 

















状况 
Ho Wit Ho Akt 
检验 决策 
TLT) | 第 1 类 错误 m 正确 
接受 原 假设 Ho | 正确 第 由 类 错误 





我 们 希望 犯 这 两 类 错误 的 概率 都 非常 小 。 但 在 一 定 的 样本 容量 下 , 减 小 a 会 引起 8 增 大 ， 
减 小 8 会 引起 a 增 大 。 鉴 于 这 种 情况 ,Neyman 和 Pearson 提出 一 个 原则 , 即 在 控制 犯 第 1 264% 
误 的 概率 a 的 条 件 下 ,尽量 使 犯 第 I 类 错误 的 概率 8 小 。 这 一 原则 的 含义 是 , 原 假设 要 受到 
维护 ,使 之 不 致 轻易 被 否定 , 若 检 验 结果 否定 原 假设 ,说 明 否定 的 理由 是 充分 的 ,同时 ,做 出 否 
定 判断 的 可 靠 程度 1 - a 也 得 到 保证 。 所 以 ,在 实际 应 用 中 ,为 了 通过 样本 观测 值 对 某 一 陈述 
取得 强 有 力 的 支持 ,通常 把 这 种 陈述 本 身 作为 原 假设 ,而 将 对 这 一 陈述 的 否定 作为 备 择 假设 。 
在 统计 推断 中 ,这 种 只 控制 a 而 不 考虑 8 的 假设 检验 , 称 为 显著 性 检验 ,a 称 为 显著 性 水 平 ,最 
常用 的 a 值 为 0.01,0.05,0.10 等 。 一 般 说 来 ,根据 研究 问题 的 情况 , 若 犯 弃 真 错误 损失 人 ,为 
减 小 这 类 错误 ,a 取 值 小 些 ,反之 ,a 取 值 大 些 。 

在 a 足够 小 的 情况 下 (一 般 也 是 这 样 选 的 ) , 犯 弃 真 错误 的 概率 就 足够 小 ,假设 检验 的 基 
本 思想 可 以 用 小 概率 原理 来 解释 。 所 谓 小 概率 原理 ,就 是 认为 小 概率 事件 在 一 次 试验 中 是 几 
乎 不 可 能 发 生 的 , 即 在 原 假设 Ho : a = po 为 真 的 情况 下 ,事件 11 Z - pxo 1 > C} 是 几乎 不 可 
能 发 生 的 。 也 就 是 说 ,如 果 原 假设 Ho : e = mo 是 真 的 ,那么 不 利于 或 不 能 支持 这 一 假设 的 事 
件 112 - po | > Cl 在 一 次 试验 中 几乎 不 可 能 发 生 ;倘若 在 一 次 试验 中 事件 11 2Z - mo 1 > CI 
竟然 发 生 了 ,我 们 有 理由 怀疑 这 一 假设 的 真实 性 ,并 拒绝 这 一 假设 。 

根据 以 上 原理 ,在 给 定 显著 性 水 平 ( 即 弃 真 错误 发 生 的 概率 )a 的 情况 下 , 若 原 假设 Ho : p 
= m 为 真 , 则 有 





PilZ-ml>C|=a (2 - 34) 
同时 ,我们 又 知道 








|| > zj- PIZ I> zal = a (2 - 35) 
中 的 za 可 从 标准 正 态 分 布 表 ( 附 表 1) 中 读 出 。 

显然 ,事件 11 Z - mo 1 > C| 与 事件 11 z | > znl 是 等 同 的 事件 , 故 也 可 把 z。 称 为 临界 
值 ,此 时 的 检验 规则 为 : 


“izi= = > za 时 ,拒绝 原 假设 ; 
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Z - m) : 
“izi= E < zn 时 ,接受 原 假设 。 


由 此 ,可 确定 拒绝 域 的 面积 为 a ,接受 域 的 面积 为 1- a( 图 2-14)。 











Fan 
图 2- 14 正 态 分 布 总 体 期 望 值 标准 正 态 分 布 双边 检验 中 


原 假设 接受 域 和 拒绝 域 的 分 布 
以 上 讨论 的 是 双边 检验 的 情况 , 下 面 对 单 边 检验 进行 讨论 。 


当 备 择 假设 为 Hi: u > po 时 的 检验 称 为 右 单 边 检验 ,检验 规则 如 下 : 





4r -三 =A > n 时 ,拒绝 原 假设 ， 


olx n 
当 z = < z, 时 ,接受 原 假设 。 


图 2-15 是 右 单 边 检验 中 原 假设 接受 域 和 拒绝 域 的 分 布 示 意图 。 
接 受 R 拒绝 R 











图 2- 15 正 态 分 布 总 体 期 望 值 标准 正 态 分 布 右 单 边 检验 中 
原 假设 接受 域 和 拒绝 域 的 分 布 


当 备 择 假设 为 H，: p < p 时 的 检验 称 为 左 单 边 检验 ,检验 规则 如 下 : 


当 z = 全 各 < - z, 时 ,拒绝 原 假设 ; 


当 z = aa >- z, 时 ,接受 原 假设 。 


图 2- 16 是 左 单 边 检验 中 原 假设 接受 域 和 拒绝 域 的 分 布 示意 图 。 
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图 2- 16 正 态 分 布 总 体 期 望 值 标准 正 态 分 布 左 单 边 检验 中 


原 假设 接受 域 和 拒绝 域 的 分 布 

3) 假 设 检验 实例 分 析 

【 例 2-7】 某 公司 想 从 国外 引进 一 种 自动 加 工装 置 ,该 装置 的 工作 温度 Z 服从 正 态 分 布 
N(p,F)。 厂 方 标明 的 平均 工作 温度 是 80Y 。 从 该 装置 试 运行 的 16 次 随机 测试 得 到 的 平均 
工作 温度 是 83Y 。 那 么 装置 运行 结果 与 厂 方 所 标明 的 指标 是 否 有 差异 呢 ? 厂 方 的 说 法 是 否 
可 以 接受 呢 ? 

解 :在 该 例子 中 ,可 以 提出 这 样 两 个 假设 :一 个 称 为 零 假设 或 原 假设 , 记 为 Ho: a =80C; 
另 一 个 称 为 备 择 假设 或 对 立 假设 , 记 为 H, :w 关 80C 。 应 如 何 做 出 判断 呢 ? 这 里 的 问题 是 样 
本 的 平均 工作 温度 83%C ,固然 与 厂 方 的 指标 89% 有 差异 ,但 根据 这 种 差异 难以 从 直观 上 做 出 
判断 ,无 法 决定 接受 还 是 拒绝 厂 方 的 说 法 。 因 为 样本 有 随机 性 ,80K 和 83 乞 的 差异 可 能 是 样 
本 的 随机 性 造成 的 。 在 这 种 情况 下 ,要 对 原 假设 Ho 做 出 拒绝 还 是 接受 的 判断 ,就 必须 根据 研 
究 的 问题 和 决策 条 件 ,对 样本 值 和 原 假设 的 差异 进行 分 析 , 若 有 充分 理由 认为 这 种 差异 并 非 完 
全 由 随机 因素 造成 的 , 即 认为 差异 是 显著 的 ,才能 拒绝 原 假设 ,否则 不 能 拒绝 原 假设 。 

由 于 该 装置 的 工作 温度 Z 服从 正 态 分 布 N(80,) ,根据 中 心 极限 定理 ,样本 容量 为 n = 
16 的 样本 的 平均 温度 Z 服从 正 态 分 布 N(80,5*/16) ,检验 统计 量 为 


Z - 80 
Ka A So 

TE a = 0.05 的 显著 性 水 平 下 , 读 标 准 正 态 分 布 表 ( 附 表 1) 得 za = 1.96。 显 然 ,1z'1 =2.4 
> zn =1.96, 故 统计 量 1z'1 值 落 在 拒绝 域 (图 2 - 13) ,由 此 可 以 认为 这 种 装置 的 实际 平均 工作 
温度 与 厂 方 说 的 有 显著 差异 , 故 拒绝 原 假设 Ho: e = 80。 

4) 正 态 分 布 总 体 期 望 值 的 : 检验 

t 检验 法 是 用 服从 + 分布 的 统计 量 检验 正 态 总 体 期 望 值 的 方法 。 假 设 样本 容量 为 n, 样 本 
均值 为 2 ,检验 的 目的 是 判断 样本 是 否 取 自 期 望 值 为 uo( 已 知 ) 和 方差 o (未 知 ) 的 正 态 总 体 ， 
即 判断 在 a 显著 性 水 平 下 ,样本 是 否 源 自 该 正 态 总 体 。 

检验 的 本 质 实际 上 是 看 样本 源 自 的 期 望 值 为 w( 未 知 ) 的 真实 总 体 与 期 望 值 为 yo( 已 知 ) 
的 正 态 总 体 在 a 显著 性 水 平 下 是 不 是 同一 个 总 体 , 即 对 假设 Ho: p = po 的 正确 性 进行 检验 ,可 


分 两 种 情况 :(1) 当 n=30 时 ,在 原 假设 Hoty = po 为 真 的 条 件 下 ， | (s 为 样本 的 均 方 


差 ) 近 似 服 从 标准 正 态 分 布 , 故 可 以 用 标准 正 态 分 布 表 进 行 假设 检验 ,检验 规则 见 表 2- 7; 
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(2) 当 n < 30 时 ,在 原 假设 Hy: e = po 为 真 的 条 件 下 ， |= Cs 为 样本 的 均 方差 ) 服 从 自由 


度 为 上 -1 的 上 分布 ( 附 表 2) ,这 时 ,用 + 分 布 表 进 行 假设 检验 ,检验 规则 见 表 2-7, 图 2- 17 为 
正 态 分 布 总 体 期 望 值 : 分 布 双边 检验 中 原 假设 接受 域 和 拒绝 域 的 分 布 示意 图 。 


表 2-7 正 态 分 布 总 体 期 望 值 的 ! 检验 表 
7 

































































检验 类 H H, > „R 
和 i 在 显著 性 水 平 a。 下 拒绝 Ho, 若 
Z- : 2% 
1 rem pio "rd PP) SE >taln-1) 
_ Z - po TAE 
u H= mo > o ród JE > ln) 
= Ż-m _. So ti 
m P= o p<po I ri <-t(n-1) 
备 t se Sa-a- 
Hoe EE ESKI 


fla) | 








pa 


tan (mn-1) 0 1 





图 2- 17 正 态 分 布 总 体 期 望 值 :分布 双 边 检验 中 原 假设 接受 域 和 拒绝 域 的 分 布 


2. 二 正 态 分 布 总 体 期 望 值 的 假设 检验 

前 面 讨论 了 单 正 态 总 体 的 情况 ,对 两 个 正 态 总 体 NC ,ci) 和 NCpa ,ci) ,常常 需要 根据 
两 个 相互 独立 的 样本 对 假设 Ho: mA - pa = 6 (6 是 给 定 的 一 个 实数 ,当然 可 以 取 0) 进 行 检验 ， 
两 个 样本 的 平均 值 分 别 为 Z 和 Z,, 方 差分 别 为 st 和 号 ,容量 分 别 为 n, 和 n ,下 面 分 两 种 情 
况 来 讨论 。 

了 ) 二 总 体 的 方差 ci 和 o, BA 

二 总 体 方差 已 知 时 ,在 原 假设 H。: y，- ma = 6 为 真 的 条 件 下 ;统计 量 (Z, - Z, - 6)/ 


A + = 服从 标准 正 态 分 布 ,于 是 ,可 以 利用 标准 正 态 分 布 数据 表 ( 附 表 1) 进 行 假设 检验 , 检 


验 准 则 见 表 2 - 8。 
2) 二 总 体 方差 未 知 但 oi = o? 
二 总 体 方差 未 知 但 oi tj o, 相等 时 ,在 原 假设 Ho : p, — wa = 6 为 真 的 条 件 下 ,统计 量 (2 
Eg 





- Z, - 6)/(ss。V Un, + Un.) 服从 自由 度 为 (n, + m — 2) 的 :分 布 ,其 中 s, 为 两 个 样本 的 平 
均 均 方差 


(2 - 36) 





式 (2-36) 中 , s, = Ha -Zm -1),s = Be - Z)/(n, -1)。 
此 时 ,可 利用 + 分布 数据 表 ( 附 表 2) 进 行 假设 检验 ， 检验 准则 见 表 2 - 8。 


表 2-8 二 正 态 分 布 总 体 期 望 值 差 的 检验 表 
oi M oj Kl gi M oj RA, fE oj = oż 
在 显著 性 水 平 a 下 拒绝 fo, 若 


下 一 可 r 
1 |= ga a 8]m ja w0||2, -2,-3| > | | dza |2-2-8]> sf 14 Tzn +m-2) 
mM m ną 
7 k 
2 m-m=óm-m>8| za, | Z-Z-0> + Ermm- 
nę * m m * m 


可 A, | 1 
3 |m- m =Ó|m = Ma <| Zi -2-8 <- my eny | B-B <= say tz 二 wm +m- 2) 
1 * m 
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3. 正 态 分 布 总 光合 的 相配 检验 

设 样本 z ,za ，…，,zm 来 自 某 一 总 体 ,检验 该 样本 是 否 来 自 于 方差 为 @( 已 知 ) 的 正 态 分 布 
总 体 NC ,8), 即 确定 原 假设 Ho:o? = oj 是 否 为 真 ,下 面 也 分 两 种 情况 来 讨论 假设 检验 问题 。 

1) 正 态 分 布 总 体 N(y ,03) 的 期 望 值 已 知 

当 正 态 分 布 总 体 N(w,ca) 的 期 望 值 已 知 时 ,在原 假 设 有 : o” = ol 为 真 的 条 件 下 ,统计 量 
nso 服从 自由 度 为 n 的 x? 分 布 ,其 中 s* = SG, - pln 为 样本 方差 ,可 以 用 x? 分 布 表 
( 见 附 表 3) 进 行 检验 ,检验 规则 见 表 2- 9。 

R2-9 正 态 分 布 总 体 方差 的 检验 表 






































| u ER u RI 
检验 类 Ho Hy zak 
| 在 显著 性 水 平 a 下 拒绝 fo , 若 
í RE: R ne leż > aln) (1-02 la > ao(n-1) 或 
SRS c nåla < a(n) (a-lo <ał_„n(n-1) 
2 a? = oj a? > od na? laż > x(n) (n-1)8 laj > x2(n-1) 
3 P= a? <oż ns" loż < aln) (n-1)8*/oż < af.„(n- 1) 
以 上 各 行 中 以 上 各 行 中 
备注 ES 2, 2- Ss ŻY? 
8 = Ds pn è = D(a- ZP/(n- 1) 
A A 








2) 正 态 分 布 总 体 N(y,03) 的 期 望 值 未 知 
当 正 态 分 布 总 体 W(w,ci) 的 期 望 值 未 知 时 ,在原 假设 H, : o” = oj 为 真 的 条 件 下 ,统计 量 
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Cn = Ds" loż 服从 自由 度 为 Cn- DA aè 分 布 ,其 中 地 = SG, - ZVC -1) 为 样本 方差, 可 以 


用 x 分 布 表 ( 见 附 表 3) 进 行 检验 ,检验 规则 见 表 2- 9。 图 2 - 18 为 正 态 分 布 总 体 方差 x? 双 
边 检验 原 假设 H。: o° = ci 拒绝 域 和 接受 域 的 分 布 示意 图 ,注意 x? 的 变化 范围 为 0~ x。 


拒 绝 域 接受 域 拒绝 域 








0 Że (n-1) Zan- x 


图 2-18 正 态 分 布 总 体 期 方差 x 分 布 双边 检验 中 原 假设 接受 域 和 拒绝 域 的 分 布 
4. 二 正 态 分 布 总 体 方差 的 检验 一 一 到 检验 
设 ansast ,二 ,为 总 体 Z, ~ NC, ci) 的 一 个 样本 ,zp ,za，…zu ,为 总 体 Za = N(pa, 
咀 ) 的 一 个 样本 ,并 且 两 个 样本 相互 独立 ,下 检验 即 是 根据 样本 的 方差 来 判断 总 体 Z ~ N(p,, 
ci) 和 总 体 Z, ~ N(pa ,ai) 是 否 为 同一 总 体 , 即 判断 原 假设 Ho :ci = o3 是 否 成 立 ,同样 可 分 两 
种 情况 来 讨论 。 
1) p, 和 A 已 知 时 
4 m, 和 jp 已 知 时 ,统计 量 Slaa - 2.) laj 服从 Flm) 分 布 ,统计 二 > (a - Z) lóż 
fi fi 
服从 X(ma ) 分 布 , 在 原 假设 Hooi = a 为 真 的 条 件 下 ,我 们 有 
go = 3 ~ F(m,m) (2-37) 
X (za - Za) moż i 
因此 ,利用 F 44 CE (BHR 4) 即 可 进行 二 正 态 分 布 总 体 方差 是 否 相等 的 假设 检验 , 检 
验 规则 见 表 2 - 10。 


NG -Dma? a 


表 2-10 正 态 分 布 总 体 方差 比 的 下 检验 表 




















każ p i T pm 和 ju 已 知 py 和 ua 未 知 
l > === 7 
在 显著 性 水 平 。 下 拒绝 所 ,车 
i si NEPI j 
g> Pa(m'ym) 或 go fram -l,m-1) 或 
1 dzą | arà Ę Ą 
sg < Fala) Z< Film- ms) 
r p 
2 EE a> a > FCm an => Flm -1n -1 
=à >å | rad m) | g> Fl 1,nm-1) J 
isä Dä si si 
3 oj = o3 gi <oż gP «(m .na) = <Fi-a(m -lnz-1) 
| ż 4 
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Nam | p | a py 和 jp 已 知 1a 和 ma 未 知 
ee 在 显著 性 水 平 。 下 拒绝 加 ,车 
以 上 各 行 中 以 上 各 行 中 
备 注 si PI - mlm i= DO - Zm - 1) 
kr 1 
à= Dia -mim sj = ŻyGa -Zn - 1) 














2) 当 p, 和 js 未知 时 


当 p, 和 p, 未知 时 ,统计 量 Ha - Z,% lej 服从 x” (n, -1 分 布 ， BEMS Ca - Za) I 
oj 服从 x*(n - 1) 分 布 ， 在 原 假设 Ho:o? = 0} 为 真 的 条 件 下 ,我 们 有 
SG, -Zn -Do 
Al 


2 
a — — — = 3 - Flm -l,m 1) (2 - 38) 
Ela- Zm- De | 

d 


因此 ,利用 F 分 布 数据 表 ( 附 表 4) 即 可 进行 二 正 态 分 布 总 体 方差 是 否 相等 的 假设 检验 , 检 
验 规则 见 表 2- 10。 图 2 - 19 为 正 态 分 布 总 体 方差 比 的 双边 F 检验 原 假设 H, : 0” = ci 拒绝 域 
和 接受 域 的 分 布 示意 图 ,注意 亚 的 变化 范围 为 0~ «c 。 


拒绝 域 CEE CEL 
- -一 十 


| | | 
JF) | 











0 Raz(m-lm-l) Faam- hm- F 


图 2- 19 正 态 分 布 总 体 期 方差 比 的 F APAE HE N AAEL ERSE RAE E RAY AA 
在 二 正 态 分 布 总 体 方差 是 否 相等 的 检验 中 ,FF 分 布 的 上 100a 百分点 F, (n, ,ma ) 是 指 满足 


Ja MF)dF = a(0 < a < 1) 的 点 ,其 中 /(F) 是 下 分 布 的 概率 密度 ,下 ,(n,,n,) 的 值 可 由 下 


F, 
atn enp) 


分 布 表 ( 附 表 4) 查 到 。 对 于 表 中 不 能 查 到 的 值 ,可 用 关系 式 Fi. (n,m) = 元 得 到 。 


第 五 节 ”概率 分 布 函数 的 拟 合 与 应 用 


一 \ 概 率 分 布 函数 拟 合 过 程 


在 具体 研究 一 个 实际 变量 时 ,如 油气 藏 储量 规模 ,我 们 常常 是 有 一 系列 数据 (样本 ) ,该 变 
+ 42 * 





量 服从 什么 分 布 ,我 们 并 不 知道 ,这 就 需要 从 实际 数据 出 发 ,进行 分 布 函数 拟 合 ,以 找到 该 变量 
或 者 说 由 数据 揭示 的 变量 分 布 的 概率 模型 。 

概率 分 布 函数 拟 合 可 以 借助 计算 机 程序 进行 ,而 简便 和 实用 的 办 法 是 借助 于 概率 纸 来 完 
成 操作 ,下 面 以 表 2 - 11 中 某 区 气 藏 规模 分 布 数 据 概率 分 布 模型 的 拟 合 来 说 明 操 作 步 骤 : 


表 2-11 某 区 气 藏 规模 分 布 数据 及 "大 于 "概率 计算 


















































编 号 规模 ,bcf 排序 (从 大 到 小 ) “大 于 "概率 ,% 
CF B 150 320 “ss 
a 2 2 150 16.67 
GEE 4 0 25 
4 T5 0 33.33 
5 15 y 55 41.67 | 
6 o 320 和 50 5 
7 z 10 30 58.33 
8 EW 20 66.67 p 
9 0 3 o 7 | 
10 z 55 10 83.8 
LL m 70 | soo 91.67 








(1) 把 变量 的 样本 值 列 于 表 中 ( 表 2- 11 中 的 第 2 列 ); 

(2) 把 样本 值 按 从 大 到 小 的 顺序 排序 ( 表 2 - 11 中 的 第 3 列 ) (在 油气 地 质 应 用 中 ,一 般 我 
们 更 关心 的 是 某 变量 大 于 某 个 值 的 概率 , 故 把 样本 值 按 从 大 到 小 的 顺序 排序 , 当 我 们 更 关心 某 
变量 小 于 某 个 值 的 概率 时 ,把 样本 值 按 小 到 大 的 顺序 排序 )， 


(3) 计 算 * 大 于 "概率 值 4F(z) = PIZ > zl = ( 见 表 2-11 中 的 第 4 列 ), 其 中 ,i 为 
序号 ,n 为 样本 容量 ( 当 第 (2) 步 中 的 样本 信 按 从 小 到 大 的 顺序 排序 时 ,计算 得 到 的 是 "小 于 " 概 
率 值 F(z) = PIZ Sal =); 


+1 
(4) 把 变量 值 * 和 其 对 应 的 “大 于 "概率 值 Pi Z > zł 投 到 对 数 正 态 分 布 概率 纸 上 ( 可 以 是 
任何 分 布 模型 的 概率 纸 ,在 这 里 之 所 以 选择 对 数 正 态 分 布 概率 纸 ,是 因为 大 量 经 验 表明 ,油气 
藏 储量 规模 常常 服从 对 数 正 态 分 布 ) , 若 得 到 一 条 直线 (图 2 - 16) , 则 变量 服从 对 数 正 态 分 布 ， 
否则 ,尝试 使 用 其 它 分 布 类 型 的 概率 纸 。 





400 上 


气 茂 规 模 ，bef 
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图 2-20 变量 分 布 函数 的 拟 合 (示意 图 ) 
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注意 图 2 - 20 仅 为 示意 图 ,不 对 应 表 2 - 11 中 的 实际 数据 。 
二 、 利 用 某 种 分 布 概率 纸 进 行 拟 合 的 基本 原理 


到 此 ,读者 可 能 会 问 ,为 什么 用 概率 纸 就 可 以 达到 概率 分 布 模型 拟 合 的 目的 ? 我 们 现在 来 
讨论 这 个 问题 。 

首先 ,我 们 来 看 一 看 直接 把 z; 一 4F(z;) 投 到 算术 坐标 系 中 会 是 什么 情形 ,图 2- 21 中 过 各 
点 连 起 来 的 曲线 实质 上 是 气 藏 规模 的 累积 概率 分 布 曲线 (经 验 ) ,根据 这 条 曲线 来 判别 气 藏 规 
模 服 从 什么 分 布 是 很 困难 的 ,因为 曲线 缺少 直观 性 。 如 果 我 们 将 坐标 系 适 当 刻 度 ,使 图 2 - 21 
中 的 曲线 变 成 直线 ,那么 ,问题 就 变 得 简单 了 。 


气 茂 规 模 ,bcf 
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图 2-21 气 藏 规模 的 累积 概率 分 布 函数 (示意 图 ) 
假定 变量 Z( 如 气 藏 规模 ) 服 从 对 数 正 态 分 布 , 意 味 着 变量 In Z 服从 正 态 分 布 , 则 有 
mZ- -= Z! - N(0,1) (2 - 39) 
式 (2- 39) 表 明 ,InZ 与 标准 正 态 分 布 变量 Z' 之 间 存 在 线性 关系 ,而 每 个 Z' 值 对 应 惟一 一 
个 4F(z) = PIZ > z) 。 若 纵 坐标 Z 取 对 数 坐 标 系 , 模 坐 标 严 用 对 应 z 的 AFC RAINE, 
则 在 经 过 刻度 的 坐标 系 中 点 出 as 一 4F(z ) ,把 这 些 点 连 起 来 ,必然 会 得 到 一 条 直线 (图 2 - 
20) 。 由 于 直线 非常 直观 ,易于 用 来 判别 数据 是 否 服从 假定 的 分 布 ,所 以 ,利用 分 布 概率 纸 进行 
拟 合成 为 常用 的 方法 。 


三 \ 概 率 分 布 函数 的 应 用 


通过 前 面 的 步骤 ,得 到 的 直线 实际 上 是 变量 概率 分 布 函数 在 适当 刻度 坐标 系 中 的 概率 分 
布 函数 ,利用 该 直线 ,就 可 方便 地 读 出 给 定 的 概率 值 所 对 应 的 变量 值 或 给 定 的 变量 值 所 对 应 的 
概率 值 。 从 分 布 直线 上 可 直接 读 出 变量 值 大 于 某 一 给 定 值 发 生 的 概率 ,如 对 应 > 200bef 的 气 
藏 规模 ,从 图 2- 20 可 示意 性 地 读 出 其 对 应 的 概率 为 28% 或 0.28, 也 就 是 说 ,发 现 储量 规模 > 
200bef 气 藏 的 概率 或 可 能 性 为 0.28。 


EFRAIM 
1. 如 何 理解 随机 变量 和 随机 向 量 ? 


2. 有 两 个 随机 变量 Z, 和 2,( 见 下 表 ), 求 其 联合 概率 密度 ,并 判别 这 两 个 变量 是 否 相互 独立 。 
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两 个 随机 变量 取 值 表 























z, A I z, Z ] z, Za 
3 6 1 10 2 9 
| = 2 7 | 2 4 8 
2 8 | 2 10 1 12 
| 2 8 t 1 u s | 6 











3. 如 何 理解 中 心 极限 定理 ? 哪些 条 件 下 中 心 极限 定理 适用 ? 哪些 条 件 下 中 心 极 限定 理 不 
适用 ? 

4. 取 n 块 岩心 测 得 孔隙 度 $ 和 渗透 率 K, 求 得 logK 与 $ 之 间 的 线性 相关 系数 为 0.62, 问 
当 分别 为 9.16.36.64 时 ,在 5% 的 显著 性 水 平 下 ,logK 与 $ 之 间 是 否 显 著 相 关 ? 从 n 的 变 
化 中 能 得 出 什么 结论 ? 

5. 已 知 某 油层 孔 阶 度 服从 正 态 分 布 ,在 该 油层 中 取 25 块 岩心 作为 样本 , 测 得 其 孔隙 度 , 得 

5 (z - ZY 

到 样本 均值 = 10, 样 本 方差 = Ei = 9, 问 在 95% 的 置信 水 平 下 ,该 油层 孔隙 度 
(总 体 ) 的 期 望 值 落 在 哪个 区 间 内 ? 

6. 已 知 某 油 层 孔隙 度 Z 服从 正 态 分 布 N(15,3)。 从 该 油层 中 取 36 块 岩心 ,36 块 岩心 分 
析 数 据 表明 孔隙 度 均值 为 20% , 问 这 36 块 岩 心 能 否 代 表 该 油层 ? 

7. 用 表 2- 11 中 的 数据 ,在 对 数 正 态 分 布 概率 纸 上 绘 出 概率 分 布线 ,并 求 出 油气 藏 规模 大 
于 50bef 的 概率 有 多 大 ?假设 该 区 的 勘探 成 功率 为 25% , 问 在 该 区 找到 一 个 大 于 50bcf 气 藏 的 
概率 有 多 大 ? 
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第 三 章 ”相关 、 回 归 及 其 应 用 


本 章 学 习 目 的 和 要 求 : 了 解 相关 、 一 元 线性 回归 和 多 元 线性 回归 的 基本 概念 , 理 
解 线性 相关 和 一 元 线性 回归 的 联系 和 区 别 以 及 各 自 的 分 析 方 法 ,熟练 掌握 最 小 二 乘 
法 方法 原理 、 应 用 条 件 及 其 在 一 元 线性 回归 和 多 元 线性 回归 分 析 中 的 应 用 。 


研究 客观 事物 的 相互 关系 , 既 要 做 定性 分 析 , 也 要 做 定量 分 析 , 考 察 它们 的 联系 程度 ,揭示 
其 变化 的 具体 形式 和 变化 规律 ,相关 和 回归 分 析 便 是 这 种 定量 分 析 的 重要 统计 方法 。 在 自然 
科学 工程 技术 和 经 济 领域 都 有 着 广泛 的 应 用 。 地 学 研究 领域 中 ,在 研究 某 一 地 质 因 素 与 特定 
地 质 现象 的 关系 时 ,相关 和 回归 分 析 已 成 为 关系 模型 建立 ,结构 分 析 和 预测 分 析 的 重要 工具 。 

本 章 首 先 通过 介绍 简单 线性 相关 和 一 元 线性 回归 ,阐明 相关 和 回归 的 基本 原理 及 它们 的 
相互 联系 和 区 别 ,其 次 展开 分 析 如 何 利用 最 小 二 乘 方法 进行 一 元 线性 回归 、 多 元 线性 回归 分 析 
及 回归 分 析 结 果 的 假设 检验 。 


WW 线性 相关 


一 、 相 关 关系 和 相关 系数 


1. 相 关 

自然 界 中 许多 现象 之 间 存在 着 相互 依赖 和 相互 制约 关系 。 这 种 关系 表现 在 量 上 主要 有 两 种 
类 型 :一 类 是 函数 关系 ; 另 一 类 是 统计 关系 或 称 相关 关系 。 相 关 关 系 是 指 变量 之 间 的 不 确定 的 依 
存 关系 。 它 同 通常 的 确定 的 函数 关系 不 同 。 通 常 的 函数 关系 表示 变量 之 间 确 定 的 依存 关系 ,对 
给 定 的 自 变量 ,有 一 个 相应 的 因 变 量 数值 ,如 圆 的 面积 S = wr” ,给 定 半径 r 便 有 一 个 确定 的 面积 
S。 但 是 由 于 地 质问 题 的 复杂 性 ,大 部 分 地 质变 量 都 是 随机 变量 ,它们 之 间 的 关系 大 多 属于 相关 
关系 ,不 能 用 确定 的 数学 函数 表示 ,而 只 能 用 某 种 统计 关系 表示 。 例 如 ,油气 储 层 中 的 孔隙 度 与 
渗透 率 之 间 的 关系 和 有 机 质 总 量 与 泥岩 体积 之 间 的 关系 等 。 在 相关 关系 中 ,变量 之 间 既 具有 某 
种 依赖 关系 ,又 具有 某 种 不 确定 性 , 即 不 能 根据 自 变 量 的 值 ,将 因 变 量 的 值 完 全 确定 下 来 。 

由 于 客观 事物 的 联系 和 变化 复杂 多 样 ,变量 间 的 相关 关系 也 有 多 种 形式 。 

按 研究 变量 的 多 少 可 划分 为 一 元 相关 (也 称 为 简单 相关 ) 和 多 元 相关 (也 称 为 复 相 关 ) :两 
个 变量 的 相关 关系 称 为 一 元 相关 。 如 总 的 生 烃 量 与 泥岩 中 有 机 质 含量 之 间 的 关系 和 声波 时 差 
与 孔隙 度 的 关系 等 。 三 个 或 三 个 以 上 变量 的 相关 关系 称 为 多 元 相关 ,如 某 圈 闭 的 油气 储 基 与 
孔隙 度 、 圈 闭 面积 、 图 闭 有 效 幅度 和 含油 气 饱 和 度 的 关系 等 。 

按 研 究 变量 之 间 的 依存 关系 的 形式 划分 为 线性 相关 (也 称 直线 相关 ) 和 非 线 性 相关 (也 称 
曲线 相关 ) : 当 一 个 变量 每 减少 一 个 单位 , 另 一 个 相关 变量 按 一 个 大 致 固定 的 增 ( 减 ) 量 变化 时 
称 为 线性 相关 ;反之 ,相关 变量 不 按 固定 的 增 ( 减 ) 量 变化 时 称 为 非 线 性 由 关 。 例 如 ,大 多 数 地 
层 的 泥 质 含量 与 自然 放射 性 强度 有 线性 相关 关系 ,而 油气 储 集 层 的 孔隙 度 和 渗透 率 的 关系 通 
常 为 非 线 性 关系 。 
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按 变量 变化 的 方向 划分 为 正 相关 和 负 相 关 : 相 关 的 变量 按 同 一 方向 变化 , 即 一 个 变量 由 小 
到 大 或 由 大 到 小 的 变化 时 ,相关 变量 随 之 由 小 到 大 或 由 大 到 小 变化 ,为 正 相关 ;相关 的 变量 按 
相反 方向 变化 , 即 一 个 变量 由 小 到 大 或 由 大 到 小 的 变化 时 , 另 一 变量 却 由 大 到 小 或 由 小 到 大 变 
化 ,为 负 相 关 。 例 如 ,河道 砂 的 储 层 厚度 与 砂 体 的 延伸 长 度 有 正 相 关 关 系 ,而 泥 质 含量 与 储 层 
和 孔隙 度 的 关系 是 负 相关 关系 。 

此 外 ,相关 关系 还 可 以 按 变量 之 间 关系 的 密切 程度 划分 为 完全 相关 、 不 相关 (或 零 相关 ) 和 
不 完全 相关 : 当 变量 之 间 的 依存 关系 密切 到 近 于 函数 关系 时 , 称 为 完全 相关 ; 当 变量 之 间 不 存 
在 依存 关系 时 ,就 称 为 不 相关 或 零 相关 ;大 多 数 相关 关系 介 于 其 间 , 称 为 不 完全 相关 。 

2. 相 关系 数 

简单 线性 相关 是 两 个 变量 的 变化 表现 为 直线 形式 的 相关 关系 。 简 单 相关 分 析 就 是 对 来 自 
同一 总 体 的 两 个 变量 之 间 的 相关 关系 进行 分 析 , 其 目的 是 对 变量 之 间 是 否 存在 必然 的 联系 , 联 
系 的 形式 ,变化 的 趋势 做 出 符合 实际 的 判断 ,并 考察 它们 联系 的 密切 程度 ,检验 其 有 效 性 。 

早 在 1890 年 ,英国 统计 学 家 Kad Pearson 便 提 出 了 一 个 测定 两 个 变量 之 间 线性 相关 的 计 
算 公式 ,通常 称 为 积 矩 相关 系数 或 动 差 相关 系数 ,其 计算 公式 为 


Pa (3-1) 
式 中 ,co 是 x 与 z 变量 的 协 方差 ia 是 x 变量 的 标准 差 ;o, 是 z 变量 的 标准 差 。 
把 协 方差 的 计算 公式 ( 见 第 二 章 ) 代 入 式 (3 - 1) 得 到 
NG - 2)(z, - 2) 
ra A ER (3 - 2) 


式 中 ,和 =z 分别 是 x 变量 z 变量 观测 值 的 平均 值 ;n 为 样品 个 数 。 
RG - 2) 适 用 于 实测 样本 数据 ,将 式 (3 - 2) 稍 做 变换 
5 (se- G-a 
9, 


r = 一 一 全 一生 一 (3 - 3) 


n 
即 可 明显 看 出 相关 系数 的 一 些 性 质 : 

(1) 相 关系 数 是 一 个 系数 ,不 受 变量 值 大 小 和 计量 单位 的 影响 ,便于 在 不 同 资料 之 间 对 相 
关 程 度 进行 比较 ; 

(2) 相 关系 数 r 的 数值 有 一 定 的 范围 , 即 1r1<1。 当 1r| = 1 时 ,表示 x 与 z 变量 为 完全 的 
线性 相关 ,也 即 为 确定 的 函数 关系 ; 当 1r1 =0 时 ,表示 x 与 z 变量 不 存在 线性 相关 ;0 < Irl<1 
时 ,表示 两 个 变量 存在 不 同 程度 的 线性 相关 。 由 此 ,可 以 确定 一 个 对 相关 程度 评价 的 标准 。 

3. 相 关系 数 的 计算 

1) 未 分 组 资料 相关 系数 的 计算 

对 于 给 定 的 = 组 测量 数据 (xi ,z;),i=1,2…n, 则 上 述 的 相关 系数 的 公式 可 以 表示 为 

M (x, - x)(z, - 2) 
prz R (3 - 4) 





2) 分 组 资料 相关 系数 的 计算 
当 原 始 数据 较 多 ,已 分 组 编 成 二 元 频数 分 布 表 ( 即 联合 概率 分 布 ) 时 ,就 要 用 各 组 的 频数 加 
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权 计 算 相关 系数 ,计算 公式 为 
nD saha - (234) ÈA) 


Fm n a = n a G sj 5) 
Ss, Da xa, - Ca? 
RH „JJ x, 的 频数 : 太 是 : 的 频数 ;六 是 x 与 4 的 联合 频数 。 


二 、 相 关系 数 的 抽样 分 布 和 显著 性 检验 


相关 系数 既 可 以 根据 总 体 的 全 部 资料 计算 ,也 可 以 根据 随机 抽样 取得 的 部 分 资料 计算 , 然 
后 推断 总 体 的 相关 系数 。 然 而 ,在 实际 工作 中 ,从 一 个 二 元 正 态 总 体 中 抽取 一 个 样本 集 ,由 于 
受 抽 样 误差 的 影响 ,在 做 出 两 个 总 体 变量 相关 的 结论 前 ,必须 检验 样本 相关 系数 r 的 显著 性 。 
事实 上 ,要 检验 总 体 中 的 两 个 变量 是 否 相 关 , 即 要 检验 两 个 变量 间 的 相关 系数 r=03 r0, 
前 者 表示 两 个 变量 不 相关 ,后 者 表示 两 个 变量 具有 相关 性 。 

在 小 样本 的 情况 下 ,上 述 相关 性 检验 可 用 Fisher 的 : 检验 实现 ,方法 原理 参见 第 二 章 的 有 
关内 容 ,下 面 仅 介绍 检验 的 步 又 。 

1) 提 出 假设 


本 :r=0; 有 :7#0, 以 1 = 17IN 了 3 为 检验 统计 量 ,其 中 ”为 样品 个 数 。 


1 

2) 查 n(n -2) 的 临界 值 

根据 给 定 的 显著 性 水 平 a, 查 + 分布 表 ( 附 表 2) 中 aln -2) 的 临界 值 。 

3) 比 较 计算 的 111 与 a(n -2) 临 界 值 

比较 计算 的 111 与 ion(n -2) 临 界 值 ,如 141 大 于 临界 值 , 就 拒绝 原 假设 ;如 141 小 于 临界 值 ， 
就 接受 原 假设 。 

这 里 需要 说 明 的 是 ,上 述 相关 系数 仅 限于 对 简单 线性 相关 关系 的 测定 , r = 0 也 只 表示 两 
个 随机 变量 不 存在 线性 相关 ,而 不 能 说 明 两 变量 为 独立 变量 ,因为 在 这 种 情况 下 ,两 个 变量 仍 
然 可 能 存在 非 线性 相关 关系 。 另 外 ,简单 线性 相关 除了 用 上 述 相 关系 数 表 示 外 ,也 可 通过 一 元 
线性 回归 模型 的 拟 合 优 度 系 数 表示 。 


第 二 节 简单 线性 回归 








一 、 回 归 分 析 的 基本 概念 


“回归 ”(Regression) 一 词 源 于 19 世纪 英国 生物 学 家 Galton 对 人 体 遗 传 特征 的 实验 研究 。 
他 根据 实验 数据 发 现 个 子 高 的 双亲 其 于 女 也 较 扁 ,但 平均 地 看 ,个子 特 高 的 双亲 其 子女 的 身高 
不 比 他 们 的 双亲 高 ;同样 ,发 现 个 子 矮 的 双亲 其 子女 也 较 矮 ,但 平均 地 看 ,个子 特 矮 的 双亲 其 子 
女 的 身高 不 比 他们 的 双亲 矮 。Galton 把 这 种 身高 趋向 于 人 的 平均 高 度 的 现象 称 为 “回归 "(Re- 
gression) ,并 将 该 概念 加 以 应 用 。 后 来 ,他 又 提出 了 “相关 ”( Correlation) 的 概念 ,由 此 逐步 形成 具 
有 独特 理论 和 方法 体系 的 回归 分 析 。 但 是 ,现在 统计 学 中 的 “回归 "概念 已 不 是 原来 生物 学 上 
的 特殊 规律 性 ,而 是 指 变量 间 的 依存 关系 。 

回归 分 析 和 相关 分 析 都 是 对 客观 事物 数量 依存 关系 的 分 析 , 在 理论 基础 和 方法 上 具有 一 
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致 性 。 只 有 存在 相关 关系 的 变量 才能 进行 回归 分 析 , 相 关 程度 愈 高 ,回归 分 析 的 结果 愈 可 靠 。 
因此 ,相关 系数 也 是 判定 回归 效果 的 一 个 重要 依据 。 另 一 方面 ,相关 系数 同 回归 模型 中 的 参数 
可 以 相互 换算 ,特别 是 多 元 相关 和 非 线 性 相关 的 相关 系数 必须 利用 回归 模型 才能 求 得 。 但 是 ， 
回归 分 析 和 相关 分 析 也 有 如 下 差别 : 

第 一 ,相关 分 析 是 研究 变量 之 间 的 共 变 关系 ,这 些 变量 相互 对 应 , 却 不 分 主 从 或 因果 。 回 归 
分 析 却 是 在 控制 或 给 定 一 个 或 几 个 变量 条 件 下 来 观察 某 一 对 应 变量 的 变化 ,给 定 的 变量 称 为 自 
变量 。 自 变量 可 以 是 随机 变量 ,也 可 以 是 确定 型 变量 ,一 般 假定 为 确定 型 变量 。 被 观察 的 对 应 变 
量 称 为 因 变量 ,是 随机 变量 。 当 给 定 一 个 自 变量 时 , 因 变量 可 能 有 几 个 取 值 , 并 且 形 成 一 个 分 布 。 
因此 ,回归 分 析 必 须根 据 研究 目的 和 对 象 的 性 质 , 确 定 哪个 是 自 变量 ,哪个 是 因 变量 。 

第 二 ,相关 分 析 主要 测定 变量 之 间 关 系 的 密切 程度 和 变量 变化 的 方向 ,而 回归 分 析 可 以 对 
具有 相关 关系 的 变量 建立 一 个 数学 方程 ,也 称 回归 模型 ,用 于 描述 变量 之 间 具 体 的 变动 关系 ， 
通过 控制 或 给 定 自 变 量 的 数值 来 估计 或 预测 因 变 量 可 能 的 数值 。 

回归 分 析 根据 实际 资料 建立 的 回归 模型 也 有 多 种 形式 。 按 自 变量 的 多 少 可 分 为 一 元 回归 
模型 和 多 元 回归 模型 ; 按 变量 之 间 的 具体 变动 形式 可 以 分 为 线性 回归 模型 和 非 线性 回归 模型 。 
把 这 两 种 分 类 标志 结合 起 来 ,就 有 一 元 线性 回归 模型 和 一 元 非 线性 回归 模型 、 多 元 线性 回归 模 
型 和 多 元 非 线性 回归 模型 。 


二 、 简 单线 性 回归 模型 


1. 一 元 线性 回归 的 数学 模型 
具有 相关 关系 的 变量 之 间 虽 然 不 具有 确定 的 函数 关系 ,但 可 借助 回归 函数 关系 表达 它们 
的 统计 规律 。 同 归 函 数 是 用 于 近似 描述 具有 相关 关系 的 变量 间 联 系 的 函数 。 
设 有 一 个 自 变量 x 和 一 个 因 变量 z, 对 于 任意 给 定 的 x; ,简单 线性 回归 模型 为 
z = Po + fx, +e, Vi (3 - 6a) 
自 变量 , 它 可 以 是 随机 变量 ,也 可 以 是 数值 可 控制 的 确定 型 变量 ; 
因 变 量 , 是 一 个 随机 变量 ; 
Bo,B 一 一 统称 为 回归 模型 的 参数 ,也 称 为 回归 系数 ; 
€; 一 一 随机 变量, 且 e, ~ N(0,0*); 
Vi 一 一 对 于 任意 io 
方程 (3 - 6a) 在 平面 直角 坐标 系 中 表示 一 条 直线 ,回归 分 析 中 称 之 为 回归 直线 。 回 归 分 析 
的 主要 目的 是 估计 式 (3 - 6a) 中 的 参数 p p ,进而 可 通过 给 定 的 x 来 估计 z。 那 么 ,这 里 就 涉 
及 如 下 一 系列 问题 :回归 模型 是 否 合适 ? 估计 精度 如 何 ? 怎样 进行 判断 和 检验 ?下面 从 理论 
和 计算 两 个 方面 讨论 这 些 问 题 。 
2. 一 元 线性 回归 系数 估计 一 一 最 小 二 乘法 基本 原理 





RP, x; 


ži 








根据 n 对 数据 (xi ,zs )(i = 1.2,…,n) 求 xz 之 间 的 回归 方程 , 即 需要 求 出 回归 模型 (3 - 
6a) 的 回归 系数 Po „Bi o 
设 as(i= 1,2,…，,n) 的 估计 值 表 示 为 
4, = b+bxi(i= 1,2,**,n) (3 - 6b) 


IAP, bo, bi ERG - 6a) 中 回归 系数 B ,8B, 的 估计 值 。 由 于 实际 测定 的 对 应 于 x; 的 某 个 数值 的 
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z, 可 能 有 多 个 值 ,通过 x; 与 z, 的 各 数值 也 可 能 有 和 多 条 直线 。 无 疑 其 中 最 具 代表 性 的 应 该 是 实际 
值 同 这 条 直线 平均 离 差 最 小 的 直线 , 亦 即 满足 5 (z, - 4) = min 的 直线 。 在 满足 这 一 要 求 的 条 


件 下 , 求 出 回归 系数 A, 的 估计 值 bo b, ,这 一 方法 称 为 最 小 二 乘法 ,其 数学 表达 式 为 
0= Da) Dla - (6, + bie) = min (3-7) 
根据 微分 学 中 求 极 值 的 原理 ， RGB- 7) 可 写成 如 下 形式 


ah +-2X[a - (by + bix)] = 0 
(3 - 8) 
A =-2))[2, -= (bo + bz) x, = 0 


m 


RG - 8) E 


» mo sh, = E 
解 方程 3- oal 


(3 - 9a) 





Daj — ni” (3-9b) 


bo =ż- b,ż 
这 样 就 得 到 了 回归 系数 Ao, p, 的 估计 值 ,6b, ,从 而 利用 式 (3 - 6b) ,就 可 得 到 对 应 于 给 定 
自 变量 值 x 的 z 变量 的 估计 值 g = bo + b,xo。 


三 \ 拟 合 优 度 系数 r 和 估计 标准 误差 


1 . 拟 合 优 度 系数 r 
前 面 用 最 小 二 乘 方 法 求 得 的 回归 直线 2 = bo + bix 确定 了 x 和 := 的 具体 变化 关系 。 但 
是 ,实际 值 是 否 紧密 分 布 在 该 直线 的 两 侧 呢 ? 其 紧密 程 
度 如 何 ? 这 些 问题 关系 到 回归 模型 的 应 用 价值 ,因此 ,对 
回归 直线 的 拟 合 优 度 必须 加 以 测定 。 下 面 讨论 拟 合 优 度 
系数 r 的 确定 方法 。 

设 有 一 个 : 的 实际 值 x ,zs 到 的 离 差 即 (z, — z) 被 回 
归 直 线 分 解 成 (zs - 2, )KI(2, — z) 两 部 分 (图 3-1), 即 有 


=h thx 








E Ne (z- 2) = (4-4) + (4,-2) (3-10) 
r Saai 对 所 有 的 实际 值 z,(i = 1,2,…,n), 求 离 差 平方 和 ， 

3-1 离 差 (zx - 下 分 解 示意 图 可 得 如 下 关系 式 
Fs) = Da- + ss (3- 11) 
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式 中 ,和 Ca - 2) WiMBŻE D G - 27 为 回归 偏差 ,是 (2 - 2) = 6? X) C - 2)” „Hi 


可 见 回归 偏差 很 大 程度 上 取决 于 回归 系数 ,所 以 也 被 称 为 回归 解释 的 偏差 ; > (z - 2) WH 
g 


余 偏 差 , 也 称 为 未 被 解释 的 偏差 。 

式 (3 - 11) 表 明 ,z 的 实际 值 同 z 的 均值 的 总 偏差 包括 两 部 分 :一 部 分 是 回归 偏差 , 即 z 和 
x 依存 关系 影响 的 偏差 ; 另 一 部 分 ,是 各 种 不 确定 因素 引起 的 随机 误差 。 在 总 偏差 一 定时 , 回 
归 偏 差 愈 大 ,剩余 偏差 就 愈 小 ;反之 ,回归 偏差 愈 小 ,剩余 偏差 就 傅 大 。 由 此 ,如 果 z 的 实际 值 
zi(i=1,2,…n) 都 紧密 分 布 在 回归 直线 的 两 侧 , 剩 余 偏差 就 很 小 ,说 明 z 和 x 的 依存 关系 很 强 ， 


总 偏差 D (= - 2)? 主要 由 回归 偏差 > (2, - 2)? 解释 ,在 极端 情况 下 ,如 都 落 在 回归 直线 
EÝ G - 407 = 0,MŻJ (z, -2 = XY(2, — 2)” ,说明 :和 x 为 确定 的 函数 关系 ,这 时 总 偏 
26) Ca - D 就 完全 由 回归 偏差 解 秋 了 。 拟 合 优 度 系数 以 回归 偏差 占 总 偏差 的 比率 来 表 
示 回 归 模 型 拟 合 的 优 劣 程度 ,其 计算 公式 为 
D-r 
J 3 - 2) 


fa 

当 z 和 两 个 变量 的 线性 依存 关系 很 密切 乃至 z 的 变化 完全 由 * 引起 时 , 亚 =1; 当 z 和 * 
两 个 变量 不 存在 线性 相关 关系 时 ,r? =0; 一 般 情 况 下 , r 处 于 0 和 1 之 间 。 在 实际 应 用 中 ,由 
实测 数据 计算 得 到 的 回归 系数 可 直接 用 于 计算 拟 合 优 度 系数 


3 + P> - nz 
Ce a 


2 


r (3 - 12) 





r = 


(3 - 13) 


nz 





从 上 面 的 分 析 和 拟 合 优 度 系数 的 定义 可 以 看 到 , 拟 合 优 度 系 数 和 前 面 讨论 的 相关 系数 
具有 一 致 性 。 事 实 上 ,可 以 证 明 ( 留 给 读者 自行 完成 ) 一 元 线性 回归 的 拟 合 优 度 系 数 r? 的 平方 
根 ,就 是 简单 线性 相关 的 相关 系数 r。 





r=: |5 (3 - 14) 
4 Dla- 
式 中 , 正 负 号 应 根据 回归 模型 中 的 回归 系数 B, 的 符号 来 确定 。 
2. 估 计 标 准 误差 
如 上 所 述 ,z 的 实际 值 同 的 总 偏差 中 ,回归 偏差 和 剩余 偏差 是 此 长 彼 消 的 关系 。 与 回归 
偏差 可 以 从 正面 来 衡量 线性 模型 的 拟 合 优 度 一 样 ,剩余 偏差 可 以 从 反面 来 判定 线性 模型 的 拟 
合 优 度 。 剩 余 偏差 ` (z, - 2) 除 以 自由 度 (n - 2) 所 得 之 商 的 平方 根 为 估计 标准 误差 ,其 公 


式 为 





。51 。 





s | —— (3 - 15) 


在 回归 分 析 中 ,估计 标准 误差 愈 小 ,表明 估计 值 愈 紧 靠 实际 值 ,回归 模型 拟 合 得 愈 好 ; 反 
之 ,估计 标准 误差 愈 大 , 则 说 明 实际 值 对 估计 值 愈 分 散 ,回归 模型 拟 合 得 傅 差 。 实 际 应 用 中 估 
计 标 准 误差 可 采用 如 下 的 简化 公式 


(3 - 16) 


作为 回归 模型 拟 合 优 度 的 判定 指标 ,估计 标准 误差 显然 不 如 拟 合 优 度 系 数 , 因 为 拟 合 优 度 
系数 是 一 个 无 量 纲 的 系数 ,有 确定 的 取 值 范围 ,便于 对 不 同 资料 的 回归 模型 的 拟 合 优 度 进行 比 
较 , 而 估计 标准 误差 是 有 计量 单位 的 ,又 没有 确定 的 取 值 范围 ,不 便于 对 不 同 资料 回归 模型 拟 
合 优 度 进行 比较 。 尽 管 如 此 ,估计 标准 误差 在 回归 分 析 中 仍 是 一 个 重要 的 指标 , 它 是 用 自 变量 
估计 因 变 量 时 ,确定 置信 区 间 的 尺度 。 

在 大 样本 的 条 件 下 (mn>30) ,用 xo 对 zo 进行 估计 的 置信 区 间 为 
Zo = 2o + znse = (bo + bixo) + ZanSw (3-17) 


在 小 样本 的 情况 下 (n < 30) ,要 用 :分布 来 确定 置信 区 间 。 在 给 定 的 置信 水 平 1 - a If, zo 


的 置信 区 间 为 
m = bżtn(n=2)s. |l+ + TE a. 
RP, taln- 2) 可 查 :分 布 表 ( 附 表 2) 得 到 ,zxo 为 给 定 的 自 变 量 的 某 一 数值 。 


由、 一 元 线性 回归 模型 的 显著 性 检验 


从 总 体 中 随机 抽取 一 个 样本 ,根据 样本 的 n 对 x 和 z 的 数据 求 得 的 线性 回归 模型 ,由 于 受 
抽样 误差 的 影响 , 它 确定 的 变量 之 间 的 线性 关系 是 否 显著 及 用 该 回归 模型 对 给 定 的 自 变 量 x 
估计 的 因 变 量 z 是 否 有 效 , 必 须 通 过 显著 性 检验 才 可 得 出 结论 。 一 元 线性 回归 模型 的 显著 性 
检验 包括 回归 系数 A 的 检验 和 模型 整体 的 检验 。 

1. 回 归 系 数 Bi 的 检验 

回归 系数 p, 是 决定 和 x 变量 线性 依存 关系 的 重要 参数 。 如 果 p = 0, 表 示 z 和 x 之 间 
不 存在 线性 关系 ,因此 ,检验 总 体 回归 系数 B, = 0 的 假设 等 于 检验 总 体 z 和 x 变量 没有 线性 关 
系 的 假设 。 

B =0 的 检验 统计 量 为 








(3 - 18) 





= (3 - 19) 


a a 
式 中 ,统计 量 S 服从 均值 为 0, 方差 为 1 的 标准 正 态 分 布 ,os 是 样本 回归 系数 B, 的 标准 误差 ， 
通常 是 未 知 的 ,要 用 它 的 估计 量 4 


a 

6, = x = 
Dls- | 
各 








m (3 - 20) 
aj — na” 





+ 52. 





代替 ,其 中 ;为 标准 估计 误差 , 见 式 (3 - 15). 
在 大 样本 条 件 下 , 按 此 统计 量 $ 对 B, 进行 显著 性 检验 ,可 查 标准 正 态 概率 表 ( 附 表 1) 确 定 
临界 值 。 如 果 是 小 样本 , 则 须 用 标准 化 处 理 的 上 变量, 即 


p Al lh! (3 - 21) 
, 


式 (3-21) 中 的 :变量 服从 自由 度 为 (n - 2) 的 4 分布 ,可 以 查 上 分 布 表 ( 附 表 2) 确 定 临界 值 
ton(n -2)。 通 过 对 比 实际 计算 的 1:1 值 和 查 表 得 到 的 临界 值 s(n -2), 若 it1< nln -2), 则 
接受 B, =0 这 一 假设 ; 若 1:1 > tn(n -2) 则 拒绝 p, =0 这 一 假设 ( 即 接受 备 择 假设 B, 40). 

2. 模 型 整体 的 FP kts 


回归 模型 的 检验 是 将 总 偏差 2 (z - z)” 进行 分 解 的 一 种 检验 方法 。 式 (3 - 11) 中 的 


各 种 偏差 都 与 一 个 自由 度 相 联 系 :总 偏差 的 自由 度 为 (n - 1) ,因为 在 计算 Ha - z)? 时 消失 


f -个 自由 度 ; 回 归 偏差 的 自由 度 为 1, 对 一 元 线性 回归 模型 来 说 ,只 有 一 -个 自 变 量 与 因 变 量 
应 ;剩余 偏差 的 自由 度 为 (n - 2) ,而 且 这 三 种 偏差 的 自由 度 存在 如 下 关系 


(n-1)=1+(n-2) (3 - 22) 
将 回归 偏差 和 剩余 偏差 各 自 除 以 它们 的 自由 度 后 再 相 除 , 便 得 到 检验 统计 量 FF, 即 
Da -z 
F = (3 - 3) 


M (z - 47/(n - 2) 
ft 


对 比 统计 量 与 拟 合 优 度 系数 下 ,可 以 用 拟 合 优 度 系数 表示 统计 晤 F, B 
2 
F = a=) (3 - 24) 
对 总 体 回归 系数 8 = 0 的 假设 检验 ,是 在 给 定 显著 性 水 平 条 件 下 ,将 计算 的 统计 量 F 与 
查 表 ( 附 表 4) 得 到 的 临界 值 Fa(1,n - 208 Fi n(1,n -2)Ł68%,% F< Fp(1,n - 2)sk F> 
书 -u(l,m -2) ,就 接受 原 假设 B=0; 若 > Fn(1,n -2)3R F<F,_p(1,n -2), 就 拒绝 原 假 
设 ( 即 接受 备 择 假设 8Bz0)。 


五 ,一 元 线性 回归 分 析 实例 
【 例 3- 1】 以 家 庭 为 单位 , 某 种 商品 的 需求 量 与 该 商品 的 价格 之 间 的 一 组 调查 数据 如 表 
3- 1 所 示 , 求 价格 对 需求 量 的 回归 关系 。 


表 3-1 商品 价格 与 需求 量 实际 调查 数据 
| 价格 x, 元 5.0 2.0 | 2.0 2.3 2.5 | 2.6 2.8 3.0 3.3 3.5 
| ARR: J 1.0 3.5 | 3.0 2.7 2.4 | 2.5 2.0 1.5 1.2 1.2 






































解 :第 一 步 :把 测量 数据 点 到 平面 直角 坐标 系 上 ,得 到 散 点 图 ,考察 相关 关系 ; 
第 二 步 :根据 点 的 分 布 趋势 ,选择 式 (3 - 6b) 作 为 回归 模型 ; 
第 三 步 :计算 回归 系数 bo b, 根据 表 3 - 1 的 数据 ,计算 出 式 (3 - 9a) 中 所 需 的 各 项 数值 并 
列 于 表 3 -2 中 ; 
SS 





R3-2 回归 模型 参数 计算 中 中 间 变量 的 数值 


















































x 5.0 2.0 2.0 2.3 2.5 2.6 2.8 3 3.3 3.5 

z 1.0 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2 

ży 5.0 7.0 6.0 6.0 6.5 5.6 4.5 4.0 4.2 55.0 

好 1.0 4.0 4.0 6.3 6.8 7.8 9.0 10.9 12.3 67.3 
X) xz; — niż 


第 四 步 : 得 到 回归 系数 b, = =-1.6,by = z- bix = 6.5 ,所 求 回 归 方程 为 





z=6.5-1.6x。 
第 五 步 :检验 回归 方程 的 显著 性 ,读者 自行 完成 。 


第 三 节 ”多 元 线性 回归 


一 、 多 元 线性 回归 的 数学 模型 和 回归 方程 
设 有 m 个 自 变量 x ,x,,…… ,xm 和 一 个 因 变 量 z, 用 自 变量 来 表示 因 变 量 的 回归 模型 可 
写成 如 下 形式 
z, = Bo + Bixa + Bixa + + Pam te Vi (3 - 25) 


式 中 ,Bo ,Bi ,PB,，,… o Pn 是 待定 常数 ;z, 和 都 是 随机 变量 ,各 自 服从 不 同期 望 值 的 正 态 分 布 x 
~AW(p,o) 和 gei~ N(0,o*) „EL. e, 之 间 是 相互 独立 的 ; 自 变量 x , za，……'，xw 可 以 是 随机 变 
量 ,也 可 以 是 数值 可 控制 的 确定 型 变量 ,通常 假定 是 后 者 。 

由 式 (3 ~ 25) 两 边 求 数学 期 望 得 到 


E(z,) = Po + Piza + Brza + eee + Vi (3 - 26) 
即 z 的 数学 期 望 E(z ) 是 变量 xn , xa ,…… ,x 的 线性 函数 。 
二 、 回 归 系 数 的 计算 方法 


假定 对 这 些 变 重 进行 了 n 次 观测 ,取得 了 个 观测 样品 ,而 且 第 i 次 观测 得 到 的 数据 为 
(nyxa ni=1,2,……,n, 根 据 实际 观测 数据 求 回 归 模 型 (3 - 25) 中 的 系数 Bo, 
Pas Bast» Ba 的 估计 值 b。,b, ,5b,,…,b。,, 即 求 回归 方程 


2 = bo + byty + bim + + bnxm (3 - 27) 


使 得 n 个 回归 值 2 = bo + bixa + baxa + + baxm(i=1,2,…,n) 与 z 的 观测 值 z; 的 偏差 平 
方 和 最 小 , 亦 即 求 偏 回归 系数 bo, bi, 5,,…,b。 使 函数 


@= Tay Db biza - bita -0 bro) (3-28) 
A A 
达到 最 小 值 , 于 是 偏 回归 系数 bo, bi, br, bn 应 满足 如 下 方程 
EHC sce A (3 - 29a) 
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2 ee atebion =: (3 -29b) 
各 
= 2 - bo - biza - baxa = ee batna = (3-290) 
; a 
æ -- 2 (3-29d) 
将 上 述 方程 整理 ,可 得 到 关于 偏 回归 系数 bo ,b, , brs, bn 的 正则 方程 
SG + biza + brzo + on + baw) = Sa (3 - 30a) 
f ff 
(wst dy R Wady DM (3 - 30b) 
fi f 
Shiri biaa E briar GE baala Dia, (3-300) 
台 台 
Db + biza + biza + + bnti) Xm = Sz, (3 - 30d) 
f a 
SEM Xin 
着 令 站 -| TOT Pa| B= Lbs bre BJ”, Z= [a ze 3,17, WRG - 30a) 
| za tm 


~ (3-30d) 可 表示 成 矩阵 形式 
(X'X)B = XZ (3 - 31) 
Rp, HERE X EAn x (m + 1) 矩阵 ,矩阵 中 的 x 表示 第 i 个 样品 在 第 j 个 变量 上 的 观测 值 (i 
=1,2,…n;j=1,2,…m)。 方 程 (3 - 31) 的 右 端 矩阵 是 自 变 量 与 因 变量 的 组 合 。 
在 多 元 线性 回归 中 , 当 观测 数据 远 多 于 变量 数 即 n >> m 时 ,和 矩阵 X 一 般 是 列 满 秩 的 ,从 
而 可 以 解 出 
B = (X'X)"'X'Z (3 - 32) 
在 实际 编程 和 应 用 中 , 常 可 对 上 述 正则 方程 组 按 如 下 形式 进行 改造 , 令 z = 15a X; = 


j 
m 


Lzy = 1,2, ,m) ,它们 分 别 代表 因 变 量 和 自 变量 的 平均 值 ,再 引入 如 下 记号 


Ie = Dm aay i) 2m) (3 — 33a) 
L= Ds SBN 2) (7 .10m) (3 - 33b) 

对 式 (3 - 30a) 取 平均 可 得 到 如 下 关系 
bo = Z -= xb — x2b2 — Xnbn (3 - 34) 


将 式 (3-34) 代 入 式 (3- 28) 
.55 ， 





Q = D(a- bo = biza - bita = "e" — bom)” 
各 


= (z -2 + byty + bx + + baza — bixa — brza = en — butin)? 


= Dilz - 2) - blza - 2,) - balza = 22)" — bl — En) T? (3-35) 


mi 


差 0 HD FOBIE 3, 求 导 得 到 


部 := 2) 


j 

















= -2(1, -hb -lab - lub) „= 1,2,**m (3 - 36) 
+2 =0(j =1,2,…m) ,得 到 偏 回 归 系数 bo, bi, bzs, bn 的 另 一 种 形式 的 正则 方程 组 
luby + lab +" + nb = by, 
= l, 
>, (3 - 37) 
bu by + babą + + lymbn = Lm 
变量 x) 和 xy 之 间 的 相关 系数 为 
SV = i 
二 一 —— = SĘ (3 - 38) 


ty =-= - = 
J$a-2*$a, SPO 
各 各 
(= ,2 my) = 1,2,*,m) 
在 方程 组 (3 - 37) 的 第 j 个 关系 式 两 边 同 除 以 Vi ,得 到 用 相关 系数 表示 的 第 三 种 形式 
的 正则 方程 组 , 即 所 谓 的 标准 化 正则 方程 组 
ob | da ba la ba | b 
VIVE VIVE JĘWL WIE 
对 式 (3 - 39) 稍 作 变 换 即 可 得 到 
u Vb, la Viab in V la 0 
Un VE tła VE tz s DL 
利用 相关 系数 的 定义 并 记 太 = (6=1,2,-,m,b, 为 标准 化 回归 系数 ) ,方程 (3 - 


M, 
40) 可 表示 为 





全 2 (3 - 39) 











ryby + raba +** + Tabs = r. = 12, ,m) (3 - 41) 
方程 (3 - 39) 的 标准 化 正则 方程 组 可 改写 为 


ruby + raba +… + ming = ru 








Tubi + robr + + Timba = Ta. 


(3 - 42) 





Taby + roby + ee + rab = r, 
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在 用 计算 机 求解 时 , 常 先 求 出 标准 化 回归 系数 ,再 求 回归 系数 。 

三 .显著 性 检验 

1.m 个 自 变量 综合 效果 检验 

在 实际 应 用 中 ,往往 事先 无 法 知道 自 变 量 和 因 变 量 是 否 具 有 线性 关系 。 因 此 ,由 上 述 计算 


得 到 的 回归 方程 是 否 具 有 代表 性 或 显著 性 ,需要 用 相应 的 方法 进行 检验 。 这 里 我 们 选用 离 差 
平方 的 分 析 考 察 回 归 效 果 的 显著 性 ,为 此 ,首先 对 因 变 量 的 离 差 平方 和 进行 因子 分 解 


L= )lG-2) = Ża +) 


= Dia -i + (5-2)? +2(z -2)(2 - 2)] 
= Da-i + DG- = Q+U (3-43) 
各 
这 里 用 到 了 关系 式 Èa - 2)(2 - z) = 0, 请 读者 自行 验证 ,在 式 (3 - 43) 中 ,0 = 


Ha - 2 六 是 残 差 平方 和 ,反映 了 随机 因素 对 z 的 影响 ; U = Ha - z)? 是 回归 平方 和 , 反 
BUT m 个 自 变量 对 因 变 量 : 的 影响 。 可 以 证 明 ,在 式 (3 - Bh k, U, Q 三 项 的 自由 度 分 别 为 


Ey mhenma (3 - 44) 
假设 Ho: By = Bi = 有 =…= 有 .=0 为 真 时 ,统计 量 
UI (n- m - DU 
=n- m- = mG 3 - 45) 


服从 自由 度 为 (m,n - m1) 的 斑 分 布 。 

在 显著 性 水 平 a 下 可 查分 布 表 ( 附 表 4) 得 到 临界 值 Fs (m,n-m- iD) 和 Fi_on(m,n 
-m1)。 当 实际 计算 得 到 的 户 > F,„(m,n- m- 1)ER F< Fon(m,n -m1), 则 否定 原 假 
设 , 认 为 回归 方程 是 显著 的 ; 当 F < Fa(m,n- m - 1)3% F> Fi.on(m,n-m-1), 接 受 原 假 
设 ,认为 回归 模型 中 的 系数 都 为 0, 尽 管 计算 得 到 的 回归 系数 可 能 与 0 有 较 大 差别 , 仍 认为 回 
归 方 程式 是 不 显著 的 。 

上 述 的 检验 实际 上 是 方差 分 析 的 内 容 之 一 ,可 用 表 3 - 3 的 方差 分 析 表 来 进行 。 

表 3-3 方差 分 析 表 
































方差 来 源 平方 和 自由 度 均 方 F 
回归 U= DUA m Ulm 
fi 
jy We 
剩余 Q=1.-U n-m-1 Ql(n-m-1) iT) 
总 和 l. = NG - 37 | n-1 | 
jet 1 L 





2. 单 变量 显著 性 检验 
以 上 是 对 m 个 变量 的 综合 效果 进行 检验 ,我 们 还 可 以 对 某 一 变量 x 的 重要 性 单独 地 进 
行 检验 , 即 检验 如 下 假设 
EE 





H: B = 0 (3 - 46) 
为 此 ,讨论 变量 x 对 回归 平方 和 的 贡献 ,对 于 m 个 变量 的 回归 方程 , 因 变量 的 离 差 平 
方 和 的 因子 分 解 见 式 (3 - 43). 
车 把 变量 x, HR, BŁ m - 1 个 变量 的 回归 方程 有 如 下 的 分 解 式 
l=0+0 (3 - 47) 
将 式 (3 - 43) 和 式 (3 - 47) 相 减 得 到 
U-D+o-0=0 (3 - 48) 
令 VW=0U-D0=0-0, 它 代表 由 于 把 变量 x 剔除 所 引起 的 剩余 平方 和 的 增 量 或 回归 平 
方 和 的 减 量 。 它 恒 为 非 负 值 ,而 且 数 值 愈 大 表明 z 愈 重要 , 称 为 2, 的 偏 回归 平方 和 。 可 以 证 
明 , 当 原 假设 Ho: 8, = 0 为 真 时 


V, 
F= 0 nm SE) 


服从 自由 度 为 (1,n - m -1) 的 FF 分 布 。 于 是 我 们 可 以 在 一 定 的 显著 性 水 平 下 检验 x 的 显著 
性 程度 。 检 验 原理 与 前 面 对 m 个 变量 综合 效果 检验 相似 ,在 此 不 再 著述 。 


四 、 复 相关 系数 和 偏 相关 系数 

1. 复 相关 系数 

考虑 回归 平方 和 U 在 因 变量 的 总 离 差 !. 中 所 占 的 比例 N = ij 用 它 来 度量 z 与 自 变量 x, ， 
23714, 之 间 关系 的 密切 程度 。 与 两 个 变量 间 的 简单 依赖 关系 相似 , 称 N 的 平方 根 


r- Jl -JE - 1-7 (3 - 50) 

为 因 变量 z 与 自 变 量 zx ,x: ,…,xw 之 间 的 复 相关 系数 , 它 反映 了 z 与 自 变量 xi ,x:，…，,xnw 之 
间 的 依赖 程度 。 与 简单 的 相关 系数 不 同 的 是 ,这 个 相关 系数 的 变化 范围 为 0< r<1, 它 不 能 取 
负 值 。 可 以 证 明 它 等 于 z 与 它 的 回归 估计 值 的 简单 相关 系数 。 回 归 估 计 值 ? 是 自 变量 x ， 
Ars ,x, 的 线性 组 合 ,而 且 是 相关 系数 最 大 的 线性 组 合 ,请 读者 自行 验证 这 一 结论 。 

2. 偏 相关 系数 

在 多 变量 系统 中 ,变量 之 间 的 关系 是 很 复杂 的 ,任意 两 个 变量 都 有 可 能 存在 相关 关系 ,这 
些 关系 又 相互 影响 。 在 这 种 情况 下 ,两 个 变量 的 简单 相关 关系 往往 不 能 反映 他 们 之 间 的 真实 
关系 ,很 可 能 出 现 一 些 假象 。 基 于 这 种 情况 ,为 了 分 别 研究 某 两 个 变量 的 相关 关系 ,必须 在 消 
除 其 它 变量 的 影响 后 计算 相关 系数 ,这 就 是 求 偏 相关 系数 。 设 有 m 个 自 变量 x) ,x,,… ,x, ,为 
了 研究 变量 x, , x, 之 间 的 关系 ,而 消除 x,,…, x。 的 影响 ,以 x;,…, x 为 自 变 量 , 分 别 作 以 
% ,za 为 因 变量 的 回归 分 析 , 设 回归 值 为 x 和 x, ,剩余 为 e = mm - 2, 和 e = x -*,, 我 们 把 
这 两 个 剩余 值 的 简单 相关 系数 定义 为 * , x, 的 偏 相关 系数 , 记 为 ms 类似 地 也 可 以 定义 其 
它 偏 相关 系数 。 

上 面 详细 讨论 了 多 元 线性 回归 分 析 的 基本 原理 实现 步骤 和 回归 方程 检验 方面 的 内 容 ,在 
实际 工作 中 ,并 不 是 每 个 变量 都 对 回归 方程 是 显著 的 。 我 们 总 是 希望 最 终 求 取 的 回归 方程 中 


既 没 有 漏 掉 对 因 变 量 有 显著 作用 的 自 变量 ,也 不 包含 对 因 变 量 无 显著 作用 的 自 变 量 。 这 就 涉 
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及 如 何 选择 变量 的 问题 。 逐 步 回归 即 是 解决 如 何 挑选 变量 并 确定 回归 方程 的 一 种 统计 方法 。 
限于 篇 幅 ,关于 逐步 回归 的 内 容 ,请 读者 参考 相关 文献 。 


五 、 多 元 线性 回归 实例 


【 例 3-2】 已 知 河北 省 某 地 在 1969 年 至 1970 年 间 , 每 月 统计 了 地 下 水 的 平均 水 位 的 高 
FE z(m) HARE x,( x 10':Vm) 和 上 一 月 地 下 水 位 的 高 度 x,( m), 测 得 的 原始 数据 列 于 表 3 
-4 中 ,试用 多 元 回归 分 析 求 z(m) 与 x,( x 10'ym) 和 x,(m) 的 回归 关系 。 


R3-4 测 得 的 z 和 x, x, 原始 数据 



























































序号 取样 日 期 x (x 10*'/m) x(m) z(m) 
1 1969.09 99.55 12.5 12.3 
2 1969.10 90.68 12.3 12.3 
3 1969.11 42.41 12.3 12.4 | 
4 1969. 12 21.51 12.4 12.6 
so 1970.01 36.51 12.6 a3 | 
6 1970.02 i 70.70 i 83 12.6 
1 1970.08 E 12.6 10.4 
8 1970.04 | 564.37 | 10.4 9.3 
9 1970.05 489.66 9.3 8.7 
10 1970.06 46.45 T 8.7 i 8.0 
KE 1970.07 375.0 5 8.0 72 
B 1970.08 | 127.42 "| 1.2 | 9.2 





解 : 设 回归 方程 为 2 = bo + bixi + bn ,由 公式 (3- 34) 和 公式 (3 - 37) 得 到 
> + lnb: = lu 
ly by + lnb: = ly 
bo = z = bx — bx 


ad - LO) sta = ta = X rasa dD) (Pe) 


mi m 1 m 


la = Di - Mya) sh = Daa HUDA) 


l= Ds -t(D i) 
将 上 表 数据 代入 上 述 公 趟 并 求解 正则 方程 组 得 到 
b, =-0.052,b, = 0.603,b, = 5.25 
为 了 进行 显著 性 检验 ,再 求 出 
l. = 49.83,U = bib, + bl = 47.03,Q = lą - U = 2.80 
f=12-1=1N,f, =2,f =11-2=9 


计量 F= r= 8- HENEN =/= 
得 到 检验 统计 量 F= 75.51, 复 相关 系数 r = gp = 0.901 AREER s = E 
35 


及 
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|? =0.558, 查 得 Foas(2,9) = 10.11( 见 附 表 4) ,因为 F > Foas(2,9) ,拒绝 原 假设 ,所 以 在 


a =0.01 的 显著 性 水 平 下 回归 方程 是 显著 的 。 
由 得 到 的 回归 方程 可 知 ,每 个 月 的 地 下 水 位 平均 高 度 与 月 开采 量 呈 负 相 关 关系 ,而 与 上 一 
个 月 的 地 下 水 平均 水 位 呈正 相关 关系 。 


含 思考 和 练习 题 镶 


1. 什 么 是 相关 ? 相关 和 回归 有 什么 异同 点 ? 

2. 用 例 3- 1 中 表 3- 2 的 数据 做 出 散 点 图 ,用 MATLAB 软件 验证 例子 中 回归 方程 ,并 对 回 
归 系 数 进行 显著 性 检验 。 

3. 解 释 复 相关 系数 、 偏 相关 系数 的 含义 ,及 它们 与 简单 相关 系数 的 区 别 。 

4. 应 用 线性 回归 模型 进行 预测 和 估计 需 注意 哪些 问题 。 

5. 某 油田 的 油气 产量 和 单位 成 本 资料 如 下 表 : 

某 油田 6 个 月 内 原油 产量 与 单位 成 本 统计 数据 表 

月 B 1 | 2 | 3 | 4 5 6 
”原油 产量 | 4 | 6 | 8 | { 8 i ` 
[ eres am | 5 | z | n | am w O 








e 

















试 做 出 单位 成 本 对 产量 的 一 元 线性 回归 模型 。 对 模型 的 优 度 进行 评价 。 对 该 模型 的 回归 
系数 进行 检验 和 模型 整体 进行 F 检验 ,计算 该 回归 模型 的 估计 误差 。 在 95% 的 置信 水 平 下 估 
计 产 量 为 10 吨 时 单位 成 本 的 置信 区 间 。 
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第 四 章 “多 元 统计 分 析 及 其 在 油气 
勘探 开发 中 的 应 用 


本 章 学 习 目 的 和 要 求 : 了 解 多 元 统计 方法 的 基本 概念 和 方法 原理 ,深刻 理解 各 种 
多 元 统计 方法 产生 的 实际 背景 ,掌握 多 元 统计 方法 的 应 用 条 件 和 范围 。 第 二 和 第 三 
章 的 知识 是 本 章 学 习 的 基础 。 


多 元 统计 分 析 简 称 多 元 分 析 , 是 统计 学 的 一 个 重要 分 支 。 随 着 计算 机 应 用 技术 的 普及 ,多 
元 统计 分 析 的 应 用 愈 来 愈 广 ,已 成 为 处 理 多 维 数据 不 可 缺少 的 工具 。 多 元 统计 分 析 是 研究 多 
个 随机 变量 之 间 的 相互 依赖 关系 以 及 内 在 统计 规律 的 一 门 统计 学 科 。 常 用 的 多 元 统计 方法 有 
多 元 回归 分 析 、 趋 势 分 析 、 聚 类 分 析 、 因 子 分 析 、 判 别 分 析 、 对 应 分 析 、 典 型 相关 分 析 、 路 径 分 析 
和 多 维 标 度 法 等 。 由 于 回归 分 析 已 在 第 三 章 作 了 介绍 ,本 章 主要 介绍 多 元 统计 分 析 中 的 趋势 
分 析 、 因 子 分 析 、 聚 类 分 析 和 判别 分 析 。 


第 一 节 ”趋势 面 分 析 及 其 应 用 


一 ,概述 


“趋势 "是 指 事物 发 展 总 的 趋向 , 它 不 受 局 部 因素 的 影响 而 由 总 的 规律 所 支配 ,如 某 一 构造 
幅度 或 某 构 造 层 厚度 的 区 域 性 变化 , 某 -地 化 指标 分 布 的 总 体 规律 等 。 趋 势 性 变化 广泛 存在 于 
沉积 学 构造 地 质 学 ,地 层 学 ,地 球 化 学 ` 石 油 和 天 然 气 地 质 学 等 学 科 所 研究 的 各 种 资料 中 。 

所 谓 趋势 分 析 就 是 要 对 数据 中 所 包含 的 三 部 分 信息 , 即 区 域 性 变化 的 信息 \ 局 部 变化 的 信息 和 
随机 变化 的 信息 进行 分 析 , 排 除 干扰 因素 , 找 出 区 域 性 变化 趋势 ,突出 局 部 异常 。 例 如 , 在 油气 勘探 
和 开发 中 , 研究 油气 地 质 特征 在 时 空中 的 分 布 趋势 和 规律 ,是 油气 地 质 研究 的 重要 问题 之 一 。 

趋势 分 析 是 用 一 个 适当 的 数学 函数 (一 维 是 直线 ,二 维 是 平面 ,三 维 是 空间 体 ) 去 拟 合 观测 
数据 ,把 观测 数据 中 受 区 域 影响 的 在 大 范围 内 变化 的 特点 与 受 局 部 影响 的 在 小 范围 内 变化 的 
特点 区 分 开 。 根 据 研究 的 问题 不 同 ,有 时 需要 将 局 部 影响 因素 分 离 出 来 ,研究 局 部 异常 的 变化 
特征 ,如 油气 物 、 化 探 异常 的 分 析 等 。 有 时 注重 全 局 性 的 变化 趋势 ,要 将 大 范围 内 的 变化 特点 
提取 出 来 ,例如 ,对 区 域 构造 基底 物探 异常 的 研究 。 至 于 何 时 区 分 全 局 性 的 变化 和 局 域 性 变 
化 ,要 看 研究 问题 的 具体 特点 而 定 。 

根据 研究 对 象 所 处 的 空间 维 数 不 同 ,趋势 分 析 有 一 维 、 二 维和 多 维 趋势 分 析 。 根 据 趋势 模 
型 中 所 含 变量 的 次 数 , 趋势 分 析 可 分 为 一 次 、 二 次 和 多 次 趋势 分 析 。 为 了 表示 地 质变 量 在 空 
间或 时 间 内 的 周期 性 变化 ,还 可 以 用 三 角 多 项 式 构造 趋势 面 函 数 ,此 时 称 为 调和 趋势 分 析 。 当 
然 , 根 据 具体 问题 的 性 质 还 可 以 选 很 多 其 它 的 趋势 函数 。 由 于 多 项 式 趋势 函数 和 三 角 多 项 式 
趋势 函数 能 在 有 限 范围 任意 逼近 各 种 连续 函数 ,在 实际 工作 中 应 用 较 广 ,下 面 以 多 项 式 趋势 面 
分 析 为 例 介绍 趋势 分 析 的 数学 函数 计算 ,趋势 面 拟 合 程度 检验 和 应 用 实例 。 其 他 各 种 趋势 分 
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析 在 原理 上 与 之 相同 ,都 是 用 最 小 二 乘法 化 成 回归 分 析 的 问题 。 
二 、 多 项 式 趋 势 面 的 计算 


多 项 式 趋 势 面 分 析 所 用 的 拟 合 函 数 是 多 项 式 , 它 具 有 计算 方便 和 所 代表 的 曲面 易于 观测 
的 优点 ,可 以 拟 合 任意 的 复杂 数据 ,在 实际 工作 中 已 得 到 广泛 应 用 。 这 里 以 二 维 趋势 面 分 析 为 
例 , 导 出 趋势 面 方程 和 介绍 趋势 分 析 的 实现 过 程 。 

用 (x,y) 表 示 样 点 的 平面 坐标 ,函数 /(x,y) 表 示 实 际 观 测 值 z 在 大 范围 内 的 变化 趋势 ， 
该 函数 表示 的 曲面 称 为 趋势 面 , 则 实际 观测 值 z 可 表示 成 

z = f(x,y) + R(x,y) (4-1) 

式 中 ,R(x,y) 称 为 剩余 , 它 由 局 部 性 变化 和 随机 性 变化 引起 。 

若 能 从 实际 观测 数据 中 把 Kx,y) 和 R(x,y) 计 算出 来 ,就 能 把 全 局 性 变化 与 局 域 性 变化 
或 随机 性 变化 区 分 开 , 这 就 是 趋势 面 分 析 的 基本 思想 。 实 际 工 作 中 ,通常 选用 某 种 特殊 函数 表 
示 趋势 面 函 数 /(x 7) ,最 常见 的 是 把 f(x,y) 表 示 成 多 项 式 ,例如 二 次 多 项 式 可 表示 成 


May) = Bo + Bix + BY + Bx + Bazy + BsY” (4 - 2) 
此 时 , 式 (4 - 1) 可 写成 如 下 形式 
z = Bo + Bixi + Bay, + Bij + Bzy, + Bs + Ri vi (4 - 3) 


表 4-1 列 出 了 常见 的 各 种 趋势 函数 的 数学 关系 和 示意 图 形 。 
表 4-1 常见 的 各 种 趋势 函数 的 数学 关系 和 示意 图 形 
分 类 | 次数 数学 方程 式 | | sm | 几何 图 形 


一 次 | No0sBeBix pa [一 
二 


a 


| 46) 
zk fla) =B+Bx+Phe 2 
维 [A 


三 次 Max) = Po + Pix + Pra? + Pix” 3 UN 

















一 次 | fMav)=B+Bix+By 2 


A. 
ii 一 次 fixy) = Bo + Rixt Bay + Pia? | s xy) „y 
维 + Buxy + Psy? e 








fixy) = Bo + Bix + Bay + Baa” + Bazy q 
三 次 BtB thiya | 9 
—MAĆ = I | 

设 在 观测 区 内 有 n 个 观测 点 ,各 点 的 坐标 和 z 的 观测 值 如 表 4 - 2 所 示 , 观 测 点 变量 的 二 
次 趋势 值 可 以 表示 成 

4 = bo + bixi + bayi + baxi + bazy, + bsy (i=12,n) (4-4a) 

IP, bo, bi s b230, bs 是 式 (4-3) 中 各 系数 Bo „Bi „82,7 „8. 的 估计 值 。 
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为 了 书写 方便 , 设 xy = 4, ta = Yis ta = AX = X), + X = 了 六, 则 式 (4-4a) 变 为 
2 = bo + bixa + box + byxa + baxu + bsxs (i = 1,2,**,n) (4 - 4b) 


由 实测 数据 ,利用 第 三 章 介绍 的 多 元 线性 回归 得 到 回归 系数 bobi, 5,,…, bs 


B = (XX)'X'Z (4 - 5) 
e E 
其 中 ,B= [bo bo b|, O F|, Zala mo al 
1 oam e as 


HARU- 5) 得 到 的 回归 系数 代入 式 (4 - 4b) 即 可 得 到 不 同 空间 点 (x, , y, ) 处 的 趋势 值 4 o 
对 于 一 般 的 ! 次 多 项 式 , 除 常数 项 以 外 ,共有 m = I(1 +3)/2 项 ,这 时 的 趋势 分 析 数学 模型 为 


z = B+ Bixi t By + Ba + Boxiy + Bsyi + eee +Bay +R Vi (4-6) 
若 把 其 中 的 每 一 项 看 作 一 个 变量 ,不 妨 设 
和 = (4-7) 


此 时 式 (4 - 6) 的 趋势 分 析 数学 模型 可 改写 为 
z = Po + Pixa + rza + Piza + Bixa + Psx + + Bozia + Ri Vi (4-8) 


表 4- 2 二 维 趋势 分 析 各 点 坐标 和 观测 值 

















点 号 x y | z 点 号 7 x y T z 
L | 
1 x n | z i 
2 a n n n A m z 
a 























仿照 上 面 二 次 趋势 面 分 析 的 做 法 ,用 最 小 二 乘法 得 到 方程 
4 = bo + bixa + bixa + byxa + byty + bsxis + ee + bnxn(i = 1,2n) (4-9) 
的 系数 为 
B = (XX)' XZ (4 - 10) 
把 由 式 (4 - 10) 计 算得 到 的 系数 代入 式 (4 - 9) 中 ,可 得 到 观测 点 的 趋势 值 3,(i = 1,2,…， 
nn), 则 观测 点 的 剩余 为 
R = z-4, (i=1,2,*,n) (4 - 11) 


三 ,趋势 面 拟 合 程度 的 检验 


一 般 来 说 ,任何 一 组 观测 数据 都 可 以 用 适当 次 数 的 多 项 式 来 表示 其 变化 趋势 。 但 这 个 多 
项 式 是 否 能 较 好 地 代表 原始 变量 Z 的 空间 变化 趋势 ,这 个 趋势 多 项 式 对 变量 的 拟 合 程度 如 
何 ,需要 用 统计 方法 进行 检验 。 统 计 检 验 的 方法 有 很 多 ,这 里 仅 利用 第 二 章 介绍 的 统计 参数 的 
显著 性 检验 方法 。 


在 假设 剩余 尺 (i = 1,2,…,n) 相 互 独立 的 条 件 下 ,对 因 变量 的 离 差 平方 和 做 如 下 变换 
人 (4 - 12) 
i à > 
其 中 LAHES =n- 1;U 的 自由 度 /, = m0 HABEn- m1。 
a 





R4- 12) 表 明 变 量 的 总 离 差 平方 和 1 TURRE: 的 总 离 差 平方 和 U 与 剩余 值 
的 平方 和 @。 这 样 可 以 定义 趋势 面 的 拟 合 优 度 系数 为 


r=L=1-2 (4 — 13) 


从 式 (4-13) 可 以 看 到 ,0< r*<1, 它 在 一 定 程度 上 反映 趋势 面 的 拟 合 程度 。 但 在 实际 工 
作 中 发 现 , 它 还 与 取样 点 的 数目 关系 极 大 。 从 式 (4 - 9) 的 线性 方程 组 解 的 分 析 可 以 知道 , 当 n 
= m+1 时 ,方程 组 满 秩 , 这 时 趋势 值 与 原始 变量 完全 拟 合 且 =l 4 n EKF m +1 时, 数 
据 的 拟 合 度 接近 1。 由 此 可 见 , 拟 合 度 r 仅 反映 对 观测 值 平均 : 的 拟 合 程度 ,并 不 能 检验 多 
项 式 的 显著 性 。 为 此 ,一 般 要 利用 式 (4 - 12) 的 离 差 平方 和 相关 的 量 ,并 考虑 自由 度 在 内 的 F 
统计 量 对 多 项 式 进 行 显著 性 检验 

RE Ulm _(n-m- DU 
nm-1) mQ 
这 里 所 要 检验 的 假设 是 
H: Bi = h = =p,=0 

所 谓 检验 结果 不 显著 , 即 接受 原来 的 假设 H, ,意味 着 多 项 式 所 有 系数 的 理论 值 都 为 0, 只 
要 有 一 个 系数 显著 异 于 0, 则 必须 否定 假设 H。。 由 此 可 见 , 这 种 假设 检验 方法 是 很 粗糙 的 ,一 
般 总 会 得 到 显著 性 的 结论 。 

比较 精细 的 方法 是 对 趋势 面 的 拟 合 度 逐 次 进行 检验 。 假 定 相 继 算出 了 (1- 1) 次 和 1 次 趋 
势 多 项 式 ,它们 的 趋势 值 离 差 平方 和 及 剩余 平方 和 分 别 为 U, U, QM Q, FER 


(4- 14) 


la = U + Qi = U + Q (4 - 15) 
当 趋 势 多 项 式 的 次 数 升 高 时 ,趋势 值 的 离 差 平方 和 不 减 ,而 剩余 平方 和 也 不 增 , 即 有 
U < U Qi: > Q (4 - 16) 
E ! 次 多 项 式 趋势 分 析 中 ,预测 关系 式 中 含有 (1+ 1) 个 【次 项 
a zly gy! „ył 
CURRIA baibain br bn „ZEE V, = U, - U TARERE I 次 多 项 式 
对 趋势 拟 合 所 做 的 贡献 ,以 它 为 基础 构造 新 的 亚 统 计量 
VICI+1) _ (n-m-1V 





Fi = n-m- =" TO 


实际 应 用 中 , 需 检验 ! 次 项 系数 的 显著 性 , 即 假设 检验 
Ho: Baai = Pala = UUU = Ba = BO =0 
X H, 为 真 时 , F, 服从 自由 度 为 (1+1,n - m-1) 的 下 分 布 。 由 下 分 布 表 ( 附 表 4) 可 按 一 
定 的 显著 性 水 平 a 查 出 相应 的 临界 值 Fo(1+1,n--m-1) 和 Fi_w(1+1,n-m-1)。 若 算 
出 的 F, 值 大 于 Fz(l+1,n -m1) 或 小 于 Fi_w(l1+1,n -m1), 则 否定 H 假设 , 即 认为 
这 些 系数 中 至 少 有 一 个 显著 地 异 于 零 ,从 (1 - 1) 次 多 项 式 升 高 到 I 次 多 项 式 是 有 意义 的 , 否 
则 ,接受 H ,认为 从 (1- 1) 次 多 项 式 升 高 到 I 次 多 项 式 是 没有 意义 的 。 


四 、 应 用 实例 


【 例 4-1】 有 某 油层 18 口 井 的 钻井 资 料 ,其 中 某 层 的 厚度 变化 如 表 4- 3 所 示 , 求 该 层 厚 
度 变 化 的 二 次 趋势 面 ,并 检验 其 显著 性 ,作出 其 剩余 分 布 图 ,指出 正常 场 分 布 。 
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(4-17) 














R1-3 某 层 的 厚度 变化 数据 表 
















































































坐标 坐标 
was | 一 一 一 了 一 一 一 一 | 厚度 z,m | NAS 厚度 zm 
< y $ z y 
1 4.21 2.85 31.0 10 4.59 sa 259.0 
2 3.93 1.70 248.5 1 4.59 3.23 259.8 
3 5.04 1.55 196.0 12 4.10 2.84 261.5 
zał | 
下 4 3.85 1.11 211.0 13 4.68 2.75 272.0 
3 4.53 3.2 248.5 14 4.70 2.75 276.5 
4 
6 4.58 2.75 244.0 15 3.77 1.32 253.5 
7 4.70 2.17 590.0 16 3.91 3.48 259.5 
| 
8 4.89 | 2.72 | 280.4 17 4.57 3.2 225.5 
9 4.56 3.19 241.0 | 18 2.48 2.80 613.0 
解 :采用 二 次 趋势 面 方程 
2 = bo + bix + bzy + bx + byy + bsy? (4 - 18) 


(1) 趋 势 面 系数 满足 的 方程 组 
18.0 77.7 46.9 341.1 203.2 130.91[ 6] F5170.7 
341.1 203.2 1517.7 896.5 568.7 || bi 21782.7 
130.9 896.5 568.7 381.2 || bz 13503.5 
6818.6 4001.7 2511.7||b,| | 94446.7 
2511.7 1657.7 || b, | | 56969.8 
1139.9.L b, 37416.9 
(2) 解 得 系数 
b, = 1189.3, b, =- 645.6, b, = 502.4 
b, = 73.6, b,4=-8.2, bs =- 100.0 
(3) 计 算 剩 余 的 平方 和 
U = 132081,/, = 5 
Q = 98910,fę = 18-5-1 = 12 
l. = 230911,/, = 17 
(4) 计 算 统 计量 


Ar 2 132081 _ 
WER r = 33011 = 57-2% 


统计 量 P= SR =3.2 
(5) 显 著 性 检验 
若 取 显 著 性 水 平 = 0.1, 查 FF 分布 表 ( 附 表 4), Fow(5,12) =3.11,H F > Fow(5,12)。 
因此 ,在 显著 性 水 平 a =0.1 下 ,趋势 面 拟 合 是 显著 的 。 


图 4- 1(a) 和 图 4- 1(b) 分 别 为 厚度 分 布 的 二 次 趋势 面 和 剩余 等 值 线 分 布 图 。 从 图 4-1 
(b) 可 以 看 到 在 B 点 附近 区 域 有 明显 的 正 异常 。 
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图 4-1 厚度 分 布 的 二 次 趋势 面 (a) 和 剩余 等 值 线 分 布 图 (b) 


五 趋势 面 剩余 分 析 和 其 他 问题 讨论 


从 上 面 的 分 析 可 以 看 到 ,趋势 面 分 析 的 思想 看 起 来 比较 简单 ,但 在 应 用 中 还 有 许多 理论 问 
题 和 实际 问题 没有 取得 一 致 的 看 法 。 例 如 ,用 趋势 分 析 解 决 系统 趋势 和 确定 局 部 异常 这 两 个 
性 质 不 同 的 问题 时 ,数学 模型 应 有 本 质 的 差异 ,但 由 于 应 用 的 数学 方法 一 样 ,或 在 同一 个 问题 
中 同时 期 望 达到 两 个 目的 ,人 们 往往 不 太 注意 数学 模型 上 的 差异 。 在 趋势 面 分 析 中 ,假设 了 有 
剩余 R(i=1,2,…,n) 存 在 ,但 在 计算 时 并 没有 对 剩余 RC = 1,2,…,n) 的 性 质 进行 分 析 。 
事实 上 ,针对 系统 趋势 分 析 和 确定 局 部 异常 这 两 个 模型 ,对 剩余 R Ci = 1,2,…,n) 应 有 不 
同 的 理解 。 在 系统 趋势 分 析 中 ,剩余 R(i = 1,2,…,n) 仅 代表 随机 误差 , 通常 假设 对 不 同 的 
观测 点 (xi, yi) 剩余 R, 相互 独立 且 满 足 高 斯 正 态 分 布 
R; = e, e; ~ N(0,0°)(i = 1,2,***,n) (4 - 19) 
而 在 确定 局 部 异常 的 模型 中 ,剩余 R, 中 应 包括 局 部 异常 r, 和 随机 误差 e 两 部 分 ,此 时 的 
局 部 异常 r 不 是 独立 的 ,而 假设 随机 误差 e, 是 独立 的 且 满足 高 斯 正 态 分 布 , 即 
R= r+te, e ~ N00)(i=1,2,.%,n) (4 - 20) 
在 研究 局 部 变化 规律 时 ,剩余 值 R, 中 包含 反映 局 部 变化 的 信息 。 实 际 工作 中 发 现 ,观测 
值 = 在 趋势 值 $ 和 局 部 异常 nr 两 者 之 和 的 附近 摆动 。 对 于 不 同 的 观测 点 ,随机 误差 。 是 相 
互 独立 的 且 满足 正 态 分 布 ,而 局 部 异常 r 却 不 独立 ,从 而 剩余 R 也 不 独立 。 剩 余 值 相关 性 较 
强 的 部 位 ,往往 指示 有 意义 的 异常 区 域 ,那么 多 大 的 剩余 量 才能 分 离 出 局 部 异常 呢 ? 针对 这 一 
实际 问题 ,一 般 需 要 确定 一 个 异常 的 下 限 值 $ > 0, 当 剩余 量 高 于 该 异常 下 限 值 时 , 则 可 分 离 出 
局 部 异常 ,否则 ,剩余 量 仅 代表 随机 变化 。 下 面 给 出 确定 异常 下 限 的 一 种 经 验方 法 。 
若 剩余 值 满足 Ri = e, ~ N(0,o)(i= 1,2,…,n), 则 满足 条 件 P| -5<R<6|l=0.95 的 6 


6 


为 
8 = 1.960 
式 中 的 是 未 知 的 , 需 用 其 估计 值 来 代替 , 即 5 = VG/Cn-m- 可 , 则 异常 的 下 限 为 
= 1.966 = 1.96% Q/(n - m- 1) 
式 中 ,(n - m - 1) 是 剩余 值 的 自由 度 , 见 表 3- 3。 
当然 还 可 以 取 全 部 正 剩余 的 平均 值 或 作 剩余 的 直方 图 , 取 其 众 数值 做 为 异常 的 下 限 。 


趋势 面 分 析 中 的 另 一 个 问题 是 趋势 面 次 数 的 确定 。 从 数学 原理 上 分 析 , 随 着 趋势 面 次 数 的 





升 高 , 拟 合 效果 会 得 到 一 定 的 改善 。 但 在 实际 工作 中 并 不 是 趋势 面 的 次 数 愈 高 愈 好 。 在 系统 趋 
势 分 析 中 , 拟 合 程度 愈 高 愈 好 ,而 在 局 部 异常 分 析 中 ,过 度 的 拟 合 有 可 能 使 剩余 异常 变 小 ,从 而 将 
一 部 分 有 意义 的 局 部 异常 归 到 系统 趋势 中 去 ,在 这 种 情况 下 趋势 面 的 拟 合 次 数 不 宜 太 高 。 

最 后 的 一 个 问题 就 是 趋势 面 的 畸变 和 正规 方程 组 的 病态 性 。 正 规 方程 的 病态 性 是 指 由 于 
个 别 测量 数据 的 错误 或 误差 造成 趋势 面 方程 式 (4 - 9) 的 系数 矩阵 为 奇异 阵 , 得 到 趋势 面 方程 
的 系数 是 一 个 奇异 解 的 现象 。 在 处 理 实际 数据 时 常会 碰 到 一 些 反常 现象 ,如 对 正 值 变 量 做 趋 
势 分 析 会 出 现 负 值 , 或 出 现 特 高 值 或 特 低 值 ,这 种 现象 称 为 趋势 面 的 畸变 ,尤其 在 没有 控制 点 
的 区 域 易于 出 现 。 


第 二 节 ”因子 分 析 及 其 应 用 


因子 分 析 方法 是 由 Spearman 在 19 世纪 初 研究 心理 学 问题 时 提出 的 ,以 后 逐渐 应 用 到 社会 
与 自然 科学 各 个 领域 。 它 主要 用 于 研究 一 组 样本 或 一 组 变量 之 间 的 相关 性 ,1957 年 由 Krum- 
bein 引进 地 质 学 。 后 来 , Imbrie 对 因子 分 析 在 地 质 学 中 的 应 用 和 发 展 作 了 大 量 工作 。 

因子 分 析 主要 研究 能 体现 变量 或 样本 数据 之 间 的 相关 关系 的 相关 阵 的 内 部 结构 ,将 许多 
原始 变量 组 合成 少数 几 个 “因子 "。 该 方法 可 以 帮助 我 们 对 大 量 地 质 观测 资料 进行 分 析 , 提 取 
原始 变量 中 的 大 部 分 相关 信息 与 变异 信息 ,对 起 决定 作用 的 重要 因素 作出 较为 合理 解释 ,是 研 
究 系统 分 类 成因 分 类 的 重要 手段 。 通 过 因子 分 析 , 可 以 再 现 原始 变量 之 间 的 相关 关系 ,揭示 
产生 这 些 关 系 的 内 在 原因 ,有 助 于 探索 事物 的 因果 关系 。 诸 多 地 质 现象 的 成 因 研究 是 地 学 研 
究 的 重要 内 容 ,因子 分 析 可 以 从 以 下 几 个 方面 为 成 因 研究 提供 帮助 : 

第 一 ,压缩 原始 数据 。 在 研究 地 质问 题 时 ,人 们 希望 收集 尽 可 能 多 的 资料 或 数据 ,而 在 综 
合 分 析 这 些 数据 以 形成 成 因 概念 时 ,又 为 面 对 众 多 的 复杂 ` 有 时 还 是 互相 矛盾 的 数据 而 苦恼 。 
因子 分 析 为 这 些 众多 复杂 数据 的 精简 提供 了 一 种 数学 算法 , 它 能 在 数量 上 大 大 精简 原始 数据 
但 又 不 损失 数据 中 包含 的 成 因 信息 。 这 样 就 有 利于 地 质 人 员 进 行 综合 分 析 。 

第 二 ,指示 成 因 推理 方向 。 因 子 分 析 能 够 把 庞杂 纷乱 的 原始 数据 按 成 因 上 的 联系 进行 归 
纳 、 整 理 , 精 炼 和 分 类 , 理 出 几 条 客观 的 成 因 线 索 ,为 地 质 人 员 提 供 逻 辑 推理 方向 ,启发 思考 相 
应 的 成 因 结论 。 

第 三 ,分 解 公 加 的 地 质 过 程 。 现 实 中 观测 到 的 地 质 现象 往往 是 多 种 成 因 过 程 环 加 的 产物 ， 
因子 分 析 提 供 了 一 个 分 解 肥 加 过 程 而 识别 每 个 单一 地 质 过 程 的 手段 。 

鉴于 上 述 原因 ,因子 分 析 在 地 学 领域 的 应 用 十 分 广泛 ,已 有 效 地 应 用 于 沉积 盆地 蚀 源 区 的 
研究 沉积 物 的 粒度 分 析 沉积 相 研究 \ 地 层 分 析 、 古 环境 与 古 生 态 的 研究 ,石油 及 天 然 气 成 因 
研究 油田 水 化 学 研究 有 机 地 球 化 学 研究 及 石油 .天然气 化 探 资料 分 析 等 各 个 方面 。 

因子 分 析 以 研究 的 目标 是 变量 的 相关 关系 还 是 样本 的 相关 ,可 分 为 R 型 分 析 和 Q 型 分 析 
两 种 。 立 足 于 变量 之 间 的 相关 性 研究 的 叫做 R 型 因子 分 析 , 立 足 于 样品 之 间 的 相关 性 研究 的 
称 为 Q 型 因子 分 析 。 现 以 主 成 分 分 析 作为 R 型 因子 分 析 的 起 点 讲述 因子 分 析 的 方法 原理 。 


一 、 主 成 分 分 析 
1. 主 成 分 分 析 及 基本 思想 
1) 什 么 是 主 成 分 分 析 


主 成 分 的 概念 最 早 由 数学 家 Karl Parson 在 1901 年 提出 的 ,当时 只 是 针对 非 随机 变量 来 讨 
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论 的 ,1933 年 Hotelling 将 这 个 概念 推广 到 随机 变量 。1957 年 Krumbein 把 该 方法 引入 到 地 质 学 
研究 ,后 来 ,又 由 Imbrie 对 该 方法 在 地 质 学 中 的 应 用 和 发 展 作 了 大 量 的 基础 工作 。 
主 成 分 分 析 是 把 数目 较 多 的 变量 作 线性 组 合 , 组 合成 几 个 能 反映 主要 地 质 特征 的 新 变 
it, 将 原 有 的 多 种 指标 重新 组 合成 一 组 新 的 互 不 相关 的 几 个 综合 指标 来 代替 原来 的 指标 , 同 
时 根据 实际 需要 从 中 取 较 少 几 个 综合 指标 ,而 且 被 选取 的 几 个 指标 要 尽 可 能 多 地 反映 原来 指 
标的 信息 。 在 地 质 学 研究 中 ,常常 要 作 多 变量 的 综合 分 析 , 这 些 变量 经 常 不 是 独立 的 ,存在 复 
杂 的 相关 关系 ,使 综合 分 析出 现 困难 ,为 使 分 析 层次 更 分 明 ,需要 用 到 主 成 分 分 析 , 即 数学 上 处 
理 降 维 的 一 种 方法 。 
日 常生 活 中 主 成 分 分 析 的 思想 也 常用 到 。 例 如 ,要 做 某 人 的 一 件 衣服 , 需 测量 许多 尺寸 ， 
如 身长 , 袖 长 ,胸围 腰围 \ 肩 宽 和 肩 厚 等 十 几 项 指标 ,但 某 一 服装 厂 要 生产 一 批 服装 不 可 能 针 
对 具体 的 某 个 人 把 尺寸 分 得 过 多 ,而 只 能 把 多 个 指标 综合 成 几 个 综合 指标 ,作为 分 类 的 型 号 。 
利用 主 成 分 分 析 将 上 述 十 几 项 指标 综合 成 三 项 指标 ,一 项 是 反映 长 度 的 指标 ,一 项 是 反映 胖 瘦 
的 指标 ,一 项 是 反映 特 体 的 指标 。 
主 成 分 分 析 还 可 以 和 其 它 方法 结合 使 用 ,如 和 回归 分 析 结合 便 形成 主 成 分 回归 , 它 可 以 克 
服 回归 分 析 中 由 于 自 变量 之 间 的 高 度 相关 而 产生 的 问题 。 
2) 主 成 分 分 析 的 基本 思想 
主 成 分 分 析 在 数学 上 就 是 将 原来 m 个 指标 作 线 性 组 合 , 求 得 新 的 综合 指标 ,并 选取 几 个 
具有 代表 性 的 综合 指标 ( 原 指标 的 线性 组 合 )。 下 面 介绍 这 种 选择 的 方法 原理 和 实现 过 程 。 
如 果 将 选取 的 第 一 个 线性 组 合 即 第 一 个 综合 指标 记 为 F ,自然 希望 局 尽 可 能 多 地 反映 
原来 的 指标 信息 ,这 里 的 “信息 "用 什么 来 表示 呢 ? 最 经 典 的 方法 就 是 用 F 的 方差 来 表示 , F 
的 方差 Var( 局 ) 愈 大 ,表示 F 包含 的 信息 愈 多 。 因 此 ,在 所 有 的 线性 组 合 中 ,选取 的 F 应 该 
是 方差 最 大 的 , 称 F 为 第 一 主 成 分 。 如 果 第 一 主 成 分 F 没有 包含 原来 m 个 指标 的 绝 大 部 分 
信息 , 须 考虑 选取 第 二 个 线性 组 合 F ABB F, 中 已 有 的 信息 不 出 现在 到 中 , 即 : 
Cov(F,,F,) = 0 (4 - 21) 
F, 称 为 第 二 主 成 分 , 依 此 可 以 建立 第 三 、 第 四 等 主 成 分 , 要 求 这 些 主 成 分 互 不 相关 , 且 方差 依 
次 减 小 。 
2. 主 成 分 分 析 的 几何 意义 和 数学 模型 
Bd ed HA n 个 样品 ,每 个 样品 测量 
了 两 个 变量 x, Mx, ,在 由 2, 和 x, 确定 的 样品 空间 中 ,m 个 样 


A 品 点 的 分 布 如 图 4-2 所 示 。 
从 图 4- 2 可 以 看 到 ,变量 x, 和 x, 都 有 较 大 的 波动 (方差 
RK) ,而 且 ,二 者 具有 明显 的 相关 性 。 如 果 作 一 坐标 旋转 , 取 
A $ 5 


A x Fy F, 为 新 坐标 轴 , 则 在 新 坐标 系 中 有 如 下 性 质 : 
JŽ (Dn 个 样品 点 的 新 坐标 局 和 F, 的 相关 性 很 小 ,几乎 
为 0; 
(2) 在 新 坐标 F, AF, 中 ,n 个 点 的 波动 (方差 ) ,大 部 分 
归结 为 F 的 波动 ,而 F, 的 波动 很 小 , 故 用 F 可 以 反映 变量 
图 4-2 样品 分 布 和 主 成 分 分 布 的 大 部 分 信息 ; 
的 关系 (3) Fi 和 F, 与 x Fl x, 间 的 关系 可 用 下 式 表示 : 
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F, = x,cosó + zasing 


F, = xącosf — xising (4 - 22) 
式 (4 - 31) 的 矩阵 表达 形式 为 ; 
F, cosg sind] | x an Gn][% x 
ea alll e RR] e- 
其 中 4=[“” “| 是 标准 正 交 短 阵 ,其 元 素 演 中 


aj +az=l 
pk G = 12) (4 — 24) 


anan + anan = 0 

从 以 上 三 点 可 以 看 出 ,这 样 得 到 F, 的 F, 和 是 无 关 的 ,而 且 F, 在 x 和 x, 的 线性 组 合 中 
方差 最 大 ,线性 组 合 的 系数 aj,(j = 1,2;7 = 1,2) 满 足 标准 正 交 的 条 件 。 

将 以 上 结果 推广 到 m 维 的 情况 , 设 有 n 个 样品 ,每 个 样品 有 m 个 变量 ,经 过 适当 的 线性 
组 合 ,可 得 到 m 个 新 变量 : 

F; = apt + apt + "+ amxn(j = 1,2,*,m) (4 - 25) 

此 时 ,矩阵 4 = [ oj'] xn 中 的 系数 mi (jj =1,2,…,m) 满 足 如 下 条 件 : 

(WF, ,F,IERYERZACJ AJ); 


(2) 线 性 组 合 的 系数 Èa =1(j=1,2**,m) ; 


(3)F, 在 xy stay" s 2m 的 所 有 线性 组 合 中 方差 最 大 F, 与 F, 不 相关 且 除 F, 外 在 x , x; ， 
Osan 的 所 有 线性 组 合 中 方差 最 大 ; 万 5 F, Fiss Fj PREHR F, Fit, 下 -外 在 x， 
221,4, 的 所 有 线性 组 合 中 方差 最 大 。 

这 样 确定 的 新 变量 F, Fas Fjart Fa 称 为 原始 变量 的 第 1、 第 2、…、 第 m 个 主 成 分 ， 
其 中 F, 在 总 的 方差 中 占 的 比例 最 大 ,最 重要 ,其 余 的 Fre, Fist Fa 的 方差 依次 递减 ， 
其 重要 性 也 依次 减 小 ,这 样 就 可 以 取 前 面 少数 几 个 主 成 分 对 样本 数据 的 主要 性 质 进 行 分 
析 。 

3. 主 成 分 的 计算 

确定 主 成 分 的 问题 ,在 几何 上 就 是 要 找 出 m 维 空间 中 样本 集 的 投影 主轴 ,在 代数 上 就 是 
找 出 严 个 变量 的 协 方差 矩阵 的 特征 向 量 。 下 面 就 代数 方法 计算 主 成 分 的 原理 和 实现 步骤 开 
展 讨论 。 

第 一 步 :原始 数据 的 标准 化 

设 有 两 个 随机 变量 x 和 xj ,n 个 观测 值 为 : 

x = (myszy szy) 2 = (Ky Lye s sty)" (4 - 26) 

上 述 变量 称 为 原始 随机 变量 ,由 于 变量 的 量 纲 和 数值 的 差别 ,在 作 主 成 分 分 析 时 , 需 对 变 
基 进 行 标准 化 处 理 , 即 : 


(1) 计 算 各 变量 的 均值: z, = 二 z iy Po 
(2) 求 出 各 变量 的 方差 : o = PPC = LD (sy -5)? 
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(3) 变 量 标准 化 : 令 新 变量 xy = a = 一 此 ,i=1,2,…n, 标 准 化 后 的 变量 满 
足 条 件 : 
0 = LD = (4 - 27) 


Èri = Ly, = IŻ =a (4 - 28) 
为 了 书写 方便 ,后 面 仍 用 入， 代表 标准 化 处 理 后 的 变量 ， 即 假定 x 入, 是 标准 化 变 
量 ,它们 的 方差 和 相关 系数 为 : 


aż 2% = laj = lò, = ny = daja, = 1 (4 - 29) 
Ty = 1Ż w = Lay, (4 - 30) 

由 上 述 公式 可 以 看 出 ,对 标准 化 变量 %, 它 的 长 度 为 : 
lall = Vx =Vn (4 - 31) 


两 个 不 相关 的 标准 化 变量 % 与 蕊 的 相关 系数 为 0, 从 代数 上 说 相当 于 它们 的 内 积 xx = 
0, 从 几何 上 说 相当 于 两 个 向 量 直 交 。 

第 二 步 :相关 矩阵 计算 

从 所 研究 的 地 质 对 象 中 , 取 n 个 样品 ,对 每 个 样品 测 得 m 个 变量 的 值 ,得 原始 数据 阵 ， 
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式 中 的 每 一 行 代表 一 个 观测 点 ,每 一 列 代表 一 个 变量 , x, 代表 第 i 个 样品 在 第 j 个 变量 上 
的 观测 值 ,zj = (ysy ay) (j=1,2,…,m) ,代表 第 j 个 变量 的 n 个 观测 值 。 

上 述 原 始 数据 阵 的 每 个 列 ,可 以 看 成 是 m 维 欧 氏 空间 的 一 个 向 量 ,用 m 个 向 量 %(j = 1， 
2,…m) 代 替 m 个 随机 变量 ,通过 研究 这 m 个 向 量 的 空间 位 置 关 系 来 研究 原来 m 个 随机 变量 
之 间 的 关系 。m 个 向 量 两 两 之 间 的 相关 系数 如 公式 (4 - 39) 所 示 , 组 成 一 个 m 阶 方 阵 R 
W: 


ru Ta Tim 

ka| O Y "alz Liy (4 — 33) 
i z i : m 
Im rm ©" Tam 


这 个 m 阶 方 阵 叫做 这 m 个 变量 的 相关 阵 , 它 是 半 正定 对 称 的 ,因此 其 特征 值 都 是 非 负 
的 。 若 m 个 变量 是 线性 无 关 的 , 则 R 是 正定 的 ,其 特征 值 为 正 值 。 相 关 阵 是 主 成 分 分 析 方法 
的 基础 ,研究 相关 阵 的 结构 也 是 因子 分 析 的 重要 内 容 。 
第 三 步 :特征 值 与 主 成 分 得 分 的 计算 
ROR 





(1) 求 出 相关 矩阵 R 的 特征 值 : 
设 避 = (wu ,an)7 为 相关 矩阵 民 的 特征 向 量 矩 阵 ,) = (A, ,2，…，,Ao ) 为 相关 矩阵 
R 的 特征 值 矩阵 , 则 有 
RU = AU (4 — 34) 
求解 R BIEHME(MA, (= 1,2, m) JEBANY 4, >> An S0, ARA FRE 
(A 2, 的 特征 向 量 w。 
(2) 确 定 主 成 分 的 个 数 p: 
一 般 按 p 个 特征 值 之 和 占 所 有 特征 值 之 和 的 百分数 大 于 90% 来 确定 应 取 的 主 成 分 个 数 
p, 并 计算 主 成 分 (j=1,2,…,p): 
F; = wx + Wax + + Ug (4 - 35) 
(3) 计 算 各 样品 在 p 个 主 成 分 上 的 得 分 , 即 对 每 个 样品 计算 出 它 的 前 p 个 主 成 分 ,第 i 个 
样品 的 第 j 个 主 成 分 的 得 分 为 : 


Fy = up + Warn + + Ugxo(i = 1,2,.°"°n;j = 1,2,**p) (4 - 36) 
(4) 利 用 p 个 主 成 分 作 地 质 解释 或 利用 样品 在 每 个 主 成 分 上 的 得 分 进行 分 类 。 
二 、R 型 因子 分 析 


将 主 成 分 分 析 向 前 推进 一 步 就 可 以 得 到 R 型 因子 分 析 。R 型 因子 分 析 中 m 个 变量 间 的 
相互 关系 是 通过 p 个 公 因子 来 表示 的 。 与 前 述 主 成 分 的 表达 式 (p 个 主 成 分 通过 变量 来 表示 ) 
比较 ,因子 分 析 采 用 的 模型 其 统计 意义 更 明确 ,有 助 于 地 质 解释 。 


1. 因 子 模型 
设 有 个 样品 ,每 个 样品 观测 了 m 个 变量 。 将 原始 数据 标准 化 后 ,得 标准 化 数据 阵 如 下 
Xij Xu Xn Xin 
ten o Pali Ko i] (4 - 37) 
i a i 
各 变量 之 间 的 相关 系数 组 成 的 相关 矩阵 为 
R= -Hw 


求 出 R 的 特征 值 4, >1,>*4,>0 及 对 应 的 单位 特征 向 量 wu , uw,,…, uw 组 成 的 正 交 矩 
阵 U=[w ,wz，,…, un]。 此 时 如 果 用 向 量 f= (Fa, Fass Fa) (i=1,2,…,n) 表 示 第 i 个 
样品 的 m 个 主 成 分 ,那么 根据 上 一 部 分 主 成 分 分 析 的 内 容 ,n 个 样品 的 主 成 分 数据 阵 可 表示 
为 特征 向 量 矩 阵 U = [ u, ,us,…, uw] 与 原始 数据 阵 的 乘积 
F =(F,,F,,*",F,) = UX = U'[X,,X,,*,X,] 
=[U'X, „U'Xą,***,U'X,] (4 - 38) 
实际 上 ,我 们 不 需要 m 个 主 成 分 ,只 需要 其 中 一 部 分 就 足以 代表 m 个 变量 的 变化 ,通常 
选取 p 个 主 成 分 ,使 
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i > 90% (4 - 39) 


它 表 示 前 p 个 主 成 分 已 解释 了 全 部 变量 变化 的 90% 以 上 的 信息 。 这 p 个 主要 成 分 对 应 的 数 
据 矩 阵 就 是 将 特征 向 量 矩阵 避 = | w ,za ,un] 剖 分 为 


u= [1 yy sey] [vv] (4 — 40) 
SES" LON 
AMAN p NARRATE, 将 过 4 40) 代 入 式 (4- 38) JE U, 与 U, 乘积 时 应 的 部 分 分 开 
Fo = UI X, (4 - 41) 
由 于 F= UPX, 故 有 
X = UF = [W, ua] 70] = U, Fo + UFo (4 - 42) 


此 式 称 为 因子 分 解 式 ,其 中 U, Fu) 这 一 部 分 是 由 p 个 主 成 分 能 解释 的 部 分 ,而 U, Fo RER 
余部 分 ,因为 
1 


l pyt 
R= XX 


JAX = W, Fo + UFaJLU Fa + UFa] 


= WCU Fw Fo UF + U, Fo Fp UF + Us Fo FU? + U, Fo F UE] 


But, R- gl U, Fo Fio UT 就 是 残余 的 协 方差 矩阵 ,如 果 残 余 协 方差 矩阵 很 接近 于 对 角 阵 ， 
表明 这 几 个 主 分 量 选 得 比较 合适 。 
若 记 残 余部 分 为 e = [el ,ea,… ,es]7, 且 将 天 写成 
X = U,Fy +e (4 - 43) 
则 (4- 43) 可 以 写成 如 下 的 模型 


x, 


un F, + UpF + "uph, + €; 


= uaF, + ug F, + uaF, + €z 


: 3 
1 








m Z Uni 下 + um Fz + *""umF, + Em 
上 述 式 子 中 各 因子 F, Fire, F, 的 方差 不 一 定 是 1, 当 我 们 要 求 它们 的 方差 为 1 时 ,就 得 到 R 
型 因子 模型 如 下 


X, = au F, + pF + aF, + ae, 


X = an F, + an Fı + **"axF, + aaE2 





Mp = Ary Fi + Ga Fi + "AF, + anEm (4 - 44) 
模型 中 每 个 变量 都 包含 有 的 因子 F, Fio, F, 叫做 公 因子 ,是 相互 独立 的 ,可 以 把 它们 
理解 为 高 维 空间 中 相互 季 直 的 p 个 坐标 轴 。e, ,e，，,…,e。 是 各 变量 特有 的 因子 ,叫做 特殊 因 
子 。 各 特殊 因子 间 以 及 特殊 因子 与 公 因 子 间 都 是 相互 独立 的 。a;. 是 第 j 个 变量 在 第 ”个 公 因 
子 上 的 负荷 ,叫做 因子 载荷 ,由 因子 载荷 组 成 的 矩阵 A 
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叫做 因子 载荷 矩阵 。wi 是 在 特殊 因子 6 的 负荷 , 叫 特殊 因子 载荷 。 
由 于 我 们 感 兴趣 的 是 主 成 分 能 表示 的 部 分 ,实际 应 用 时 常常 略 去 特殊 因子 部 分 ,于 是 , 因 
子 分 析 的 简化 模型 是 


x, = 





(4 - 45) 
用 矩阵 形式 表示 为 
X = AF (4 - 46) 
Heh X = (2,,22,70,2,) FEF Fa) o 
2. 因 子 模型 中 各 个 量 的 统计 意义 与 因子 模型 的 几何 意义 
弄 清 模型 中 各 个 量 的 统计 意义 对 因子 分 析 结果 的 解释 十 分 重要 。 设 模型 中 各 因子 和 特殊 
因子 都 是 标准 化 的 (均值 为 零 ,方差 为 1) 变 量 , 则 各 个 量具 有 如 下 统计 意义 。 
1) 因 子 载荷 a 的 统计 意义 
由 式 (4- 44) 有 X, = ap F, + az F, + + a, F, + ae, 
则 qF; = ay F, F; + ag FF; + + a, FF: + ob) (4 - 47) 
对 式 (4 - 47) 取 数学 期 望 , 因 各 公 因 子 已 标准 化 且 相互 独立 ,可 得 
E(x,F.) = ap ECF, Fj) + azE(F,F,.) + 
e + a E(FF,) + ** + a„E(F„F,) + a,Ee,F;) (4 - 48) 
rl.) = a, 
HF, r(a,F, ) 表 示 % 与 所 ,的 相关 系数 。 上 式 说 明 变量 x TEXT F, LMIATŚRA a, BIE 
与 己 . 的 相关 系数 ,表征 了 x 与 公 因子 .的 关联 程度 。 


2) 变 量 共同 和 h 及 其 统计 意义 
因子 载荷 矩阵 A 中 各 行 元 素 的 平方 和 叫做 变量 的 共同 和 ,第 j 个 变量 的 变量 共同 和 是 
h = To (G=1,2,**,m) (4 - 49) 


为 了 说 明 其 统计 意义 , 现 对 因子 模型 中 的 变量 % 计算 其 方差 (用 Dln) RR) 

Dlx) =a D(F), + ażD(F,) + ** + aD(F,) + ażD(e,) 
= aj +ah+*" +a, +aj = hi + aj (4 - 50) 

但 D(x,) =1, 故 有 
D(x) = hi +aj = 1 (4 - 51) 
即 变量 x 的 方差 由 两 部 分 组 成 ,第 一 部 分 为 共同 和 h, CESWARAT x 的 总 方差 所 作 的 贡 
献 , 第 二 部 分 是 特殊 因子 产生 的 方差 , 称 特殊 因子 方差 , 仅 与 x 本 身 的 变化 有 关 , 它 是 使 变量 
x, 的 方差 为 1 的 补充 值 。 这 样 就 可 以 从 共同 和 接近 于 1 的 程度 来 说 明 公 因子 是 否 能 代表 原始 
B- 





变量 的 变化 。 
3) 公 因子 万 的 方差 贡献 5 的 统计 意义 
因子 载荷 矩阵 中 各 列 元 素 的 平方 和 记 为 


- Hd (= 1,2,*,m) (4 - 52) 


它 是 同一 公 因 子 万 POSŁANKA 和 ,是 衡量 公 因子 万 相对 重要 性 的 指标 。 
4) 因 子 载荷 矩阵 中 不 同 两 行 的 对 应 元 素 乘积 之 和 的 统计 意义 
由 因子 模型 有 xm = (X aF + aa) 人 Sank, + apep) 
4 jj t, AD 
= Saa Gj=12*,pHi z j) (4 - 53) 
ff 
BI x 与 %, 的 相关 系数 (j 了 六) 就 等 于 4 的 第 j 行 与 第 六 行 对 应 元 素 乘积 之 和 。 
5) 因子 模型 的 几何 意义 
仅 对 简化 因 子 模型 讨论 ,我 们 把 互 不 相关 的 各 自 方差 为 1 的 p 个 公 因 子 想象 成 p 个 互相 
垂直 的 单位 矢量 ,以 它们 为 坐标 轴 就 构成 了 p 维 空间 的 
一 个 直角 坐标 系 ,我 们 称 这 些 坐标 轴 为 因子 轴 。 这 样 每 
个 变量 二 =1,2,…,m) 就 可 以 用 p 维 空间 的 一 个 向 量 
x, 来 表示 , 它 在 公 因 子 上 的 载荷 就 是 该 向 量 在 这 些 因 子 
F 轴 上 的 投影 , 即 
a =|x,|cos(x,,F,) (= 12…p) 
zy —5 图 4-3 给 出 了 p=2 时 的 示例 ,z% EF, 上 的 载荷 为 oj， 
在 F, 上 载荷 为 ap,xj, 在 Fi 上 的 载荷 为 ,在 F, E 
载荷 为 ua。 图 中 x, 在 F 上 的 载荷 较 大 ,也 就 是 % 与 
F, 的 相关 较 密切 ,此 时 向 量 x, 与 F, 的 夹 角 很 小 ,方向 趋 于 一 致 。 
以 上 所 讲 的 因子 模型 和 因子 载荷 的 几何 解释 可 以 给 我 们 一 个 直观 的 几何 概念 或 图 形 ,为 
今后 的 研究 带 来 方便 。 
三 、Q 型 因子 分 析 


前 面 介 绍 的 R 型 因子 分 析 是 研究 变量 间 的 相互 关系 ,Q 型 因子 分 析 则 是 研究 样品 间 的 相 
互 关 系 。 在 R 型 因子 分 析 中 用 相关 系数 作为 变量 间 的 相似 性 度量 ,在 Q 型 因子 分 析 中 也 需要 
选择 样品 间 合适 的 相似 性 度量 。 这 里 选择 Imbrie 提出 的 比例 相似 系数 ,从 比例 相似 系数 矩阵 
出 发 建立 了 Imbrie 的 Q 型 因子 分 析 。 另 外 也 可 选择 各 种 距离 系数 ,从 距离 系数 矩阵 出 发 建立 








图 4-3 简化 因子 模型 的 几何 意义 


Q 型 因子 分 析 。 
BŁ ”个 样品 m 个 变量 的 原始 数据 矩阵 为 
xn Xn "U Xim 


"|= Bota] (4 - 54) 
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Q 型 因子 模型 是 将 n 个 样品 用 p 个 主因 子 ( F,, Fro, F ) 表 示 , 其 简化 的 模型 是 : 


X = QyF; + anfi + 







X = ay F, + ay F; + 
X, = an F, + apFy +- + AF, (4 - 55) 

Q 型 因子 分 析 的 进行 步骤 完全 类 似 于 R 型 因子 分 析 , 只 不 过 是 从 相似 矩阵 出 发 而 已 。 

第 i 个 样品 与 第 j 个 样品 的 相似 系数 为 


cosb,, = -=t (4 - 56) 


进一步 可 得 相似 系数 矩阵 [cosb],.。, 求 出 它 的 前 p 个 特征 值 h „42,004, 及 对 应 的 特征 向 量 
us ua,"… 则 得 主因 子 解 oj = wu ,(I=1,2,**,n;j=1,2,*,m) 

1 .方差 最 大 正 交 旋 转 

前 面 导出 了 主因 子 解 ,无 论 对 R 型 或 Q 型 因子 分 析 , 我 们 的 目的 不 仅仅 是 要 找 出 几 个 公 
因子 ,更 重要 的 是 想 知道 每 个 公 因子 代表 的 地 质 意义 。 主 因子 解 只 是 众多 因子 解 中 的 一 个 ,或 
许 还 有 其 它 因子 解 更 具有 易于 解释 的 地 质 意义 。 为 了 找到 这 样 的 因子 解 ,我 们 可 以 对 主因 子 
载荷 矩阵 进行 旋转 ,使 其 结构 简化 ,即使 每 个 因子 载荷 的 平方 按 列 方向 0 和 1 两 极 分 化 ,使 第 i 
个 主因 子 的 代表 性 样品 在 F 因子 轴 上 的 载荷 趋 于 1 ,而 在 其 它 因子 轴 上 的 载荷 趋 于 0, 这 样 便 
于 对 每 个 主因 子 进行 地 质 解释 。 例 如 图 4 - 4a 表示 8 个 假想 的 样品 在 两 个 因子 轴 工 与 世上 的 
原始 位 置 , 图 中 看 到 ,它们 在 因子 轴 工 与 [上 的 载荷 差别 不 大 ,因而 不 便利 用 因子 I 与 了 对 各 
样品 进行 解释 。 但 如 果 将 轴 工 与 [ 正 交 旋转 一 个 0 角 ( 如 图 4-4b) 到 因子 轴 工 ' 与 了 ' 的 位 置 ， 
则 情况 将 大 大 改善 ,8 个 样品 的 因子 载荷 开始 分 化 ,样品 1,2、3、4 在 因子 轴 工 ' 上 的 载荷 较 大 ， 
而 在 芽 " 上 载荷 较 小 ,样品 5.6.7.8 在 工 上 的 载荷 较 小 而 在 开 ' 上 载荷 较 大 。 这 样 ,因子 工 ' 主 
要 反映 的 是 样品 1.2、3、4, 因 子 卫 “主要 反映 的 是 样品 5.6、7、8。 
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图 4- 4a PEMTEPI NA FW I GII ERRA 图 4- 4b 两 个 因子 轴 旋 转 后 的 位 置 

上 述 旋转 变换 为 正 交 旋 转变 换 , 代 数 上 即 对 因子 载荷 阵 A 作 正 交 变换 。 这 里 采用 的 变换 
称 为 "方差 最 大 正 交 旋 转变 换 ”, 即 使 因子 载荷 矩阵 4 中 各 因子 载荷 的 方差 达到 最 大 作为 因子 
载荷 矩阵 简化 的 标准 。 

下 边 用 Q 型 因子 模型 来 说 明 实 现 旋转 变换 的 原理 和 方法 , 设 Q 型 因子 载荷 矩阵 4 AEX 
旋转 9 角 后 为 B 
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an Ga UO dy ba ba | by 
为 避免 负 值 ,我 们 采用 因子 载荷 的 平方 值 ,于 是 第 了 个 ) = 1,2,…,P 因子 载荷 值 平方 的 方 
差 为 
= [D0 -3( (D1] (4 — 57) 
如 果 史 为 最 大 , 则 此 时 它 的 组 分 或 趋 于 1 或 趋 于 0, 使 因子 具有 最 大 的 简化 性 。 对 整个 因子 载 
荷 和 矩阵 的 简化 , 则 可 由 个 因子 载荷 值 平方 的 方差 之 和 作为 衡量 的 标准 。 即 
v= Dy -ISD -E (4 - 58) 
名 Ala 各 
考虑 到 各 个 样品 共同 和 之 间 的 差异 所 造成 的 不 平衡 , 作 旋转 变换 后 的 B 矩阵 进行 规格 化 处 
理 , 即 以 成 /所 代替 上 式 中 的 z: 
13 {Dm 7-1 Sen) ) (4 - 59) 
nl a, 
实际 上 ,我 们 要 求 经 旋转 后 的 与 要 使 了 达到 极 大 。 
对 4 进行 正 交 旋转 ,相当 于 对 所 有 因子 面 F,- F;(qg=1,2,:p-1);(l=q+l,qg+2,", 
了 ) 正 交 旋 转 一 个 角度 0, ,每 次 的 转角 0 必须 满足 使 上 式 中 的 Y 达到 最 大 ,这 相当 于 求 一 正 交 
HRE TAE B= AT 满足 Y 为 最 大 这 一 条 件 。 设 对 因子 面 F, - F, 旋转 一 角度 9 时 的 正 交 和 矩阵 
为 
1 9 l 


= cosĝy ©  sinóy 
Ty = : : (4 — 60) 
sinóy >> cosy 
1 
Ti 是 p 阶 和 矩阵 ,对 角 线 上 除 q 行 9 列 和 1 行 1 列 的 元 素 为 cosgu 外 ,其 余 均 为 1, 非 对 角 元 素 除 
标明 的 元 素 以 外 ,其 余 均 为 零 。 
将 A 作 正 交 旋 转 9, 后 得 到 B= AT, = [b,],B 中 的 元 素 bi=1,2,…,j=1,2,…,m 为 
b, = ancosOn + aasinO, 
by =- asinóy + aycosóy (j= q,l) 
by =a; (4-61) 
MRA p 个 主因 子 , 必 须 将 两 两 配对 旋转 , 共 旋 转 p(p - 1)/2 次 ,全 部 旋转 完毕 算 一 个 循 
环 ,此 时 得 因子 载荷 阵 为 
Ba) = ATa Ty" Ti- = all 直 Ty = AC; (4 - 62) 


其 中 ,Ci = Å TEER, Buy 是 对 A 施行 正 交 变换 C, 后 得 出 的 ,对 于 Bo 
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可 由 (4- 59) 式 算出 其 Yo 
在 第 一 个 循环 基础 上 ,从 Bu 出 发 在 进行 第 二 个 旋转 循环 ,然后 得 Bo , 即 
Bo = Bo [I TĪ T; = Bo Co = AGC, (4 - 63) 


ELETTI 


M Ba TAHER Voo 如 此 继续 下 去 ,不 断 重复 这 样 的 旋转 循环 ,就 可 以 得 到 Y 值 的 一 
个 非 降序 列 
yo < Yo s Yo 三 … (4 - 64) 


由 于 因子 载荷 的 绝对 值 不 大 于 1, 故 该 序列 是 有 上 界 的 ,因而 必 收敛 于 某 一 极限 ,了 即 是 V 
的 最 大 值 。 也 就 是 说 ,只 要 循环 次 数 k 充分 大 就 会 有 
|Vw-Vl<e (4 = 65) 
式 中 ,e 是 给 定 的 精度 。 
实际 计算 中 ,只 要 第 次 与 第 -1 次 两 次 循环 所 得 的 Wo 与 wy 满足 
| Vo -Vav|l<e (4 - 66) 
时 即 可 停止 ,将 最 后 得 到 的 矩阵 Bio 作 规格 化 还 原 , 即 得 旋转 后 的 因子 载荷 阵 。 
最 后 一 个 问题 是 如 何 确定 任 一 次 变换 7, 中 的 9, (以 下 简 记 为 6) ,以 使 了 经 Tv 变换 后 达 
到 最 大 ,为 此 ,可 将 (4- 62) 式 代 人 (4 - 60) 式 ,然后 再 对 6 求 一 阶 导数 令 其 为 0 即 可 解 得 


D-2ABIN 各 | x Lb E 
wt = GE = 于 (~ 至 <49 < 号 ) (4 - 67) 





HPA = Syms B = Dy, C= Dlh -Y,D = 23) ViVi = Z(aylh;)(aylh,) p, = 


(alh) ~ ( ah.) 
因为 在 (4 - 61) 式 中 实际 用 到 的 是 sind 和 cos6 ,编程 中 常 采 用 以 下 式 子 来 求 sing 和 cos0 
的 值 
cos48 = xol Vx + 24 cos20 = V (1 + cos46)/2 
cosó = v (1 + cos28)/2 sinô = sign( x,) V1 - cos'8 (4 - 68) 
至 此 已 完成 了 从 主因 子 载荷 矩阵 出 发 ,经 方差 最 大 正 交 旋转 , 求 旋转 后 的 因子 载荷 矩阵 的 全 过 
程 。 
2. 因 子 得 分 的 计算 
上 述 的 Q 因子 模型 是 将 样品 表示 为 公 因子 的 线形 组 合 ,这 些 公 因子 往往 与 一 定 的 地 质 成 
HAK. 反 过 来 ,也 可 以 将 公 因 子 表 示 为 样品 的 线形 组 合 , 即 用 
F; = Byt + Byta + + Baj = 1,2, ,p) (4 - 69) 
来 计量 各 样品 的 因子 得 分 。 对 0 型 分 析 来 说 ,因子 得 分 是 因子 中 各 个 变量 的 取 值 ,可 用 以 研 
究 因子 的 成 分 。 下 边 以 @ 型 因子 分 析 为 例 讨论 因 子 得 分 的 计算 , R 型 因子 分 析 的 情况 可 以 类 
似 得 出 。 
如 果 公 因 子 已 提取 全 部 信息 的 90% 以 上 , 则 可 以 采用 简化 的 因子 模型 


X = AF (4 - 70) 
由 于 其 中 4 是 n x p BERKAH A 左 乘 上 式 两 端 , 然 后 再 用 AA 的 逆 阵 左 乘 两 边 , 即 
A'X = ATAF 
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F = (A'A) AX (4 - 11) 

这 就 是 因子 得 分 的 直接 计算 公式 。 

3. 因 子 分 析 计算 步 又 

SU Q 型 因子 分 析 为 例 说 明 因子 分 析 计 算 步 又 , R 型 因子 分 析 与 此 类 似 ,但 应 从 相关 系 
数 矩阵 出 发 。 

(1) 收 集 整 理 好 原始 数据 矩阵 。 

(2) 对 原始 数据 作 数据 标准 化 变换 。 

(3) 计 算 p 个 样品 间 的 相似 系数 ,形成 相似 系数 答 阵 R。 

(4) 求 出 R 的 特征 值 并 按 大 小 排列 为 X, >1,>11>4,>0, ZHAREF A, 的 单位 特征 向 量 w 
(i=1,2,*,p)o 

(5) 确 定 公 因子 个 数 p( 按 前 p 个 特征 值 之 和 占 特征 值 总 和 的 百分数 大 于 90% 来 确定 个 数 
p)o 

(6) 求 出 主因 子 载荷 矩阵 4 = [oj],o = uA, o 

(7) 计 算 共 同和 hihi 是 否 接 近 于 1, 说 明 公 因 子 是 否 已 提取 了 变量 x 的 大 部 分 变化 信 
息 。 

(8) 将 因子 载荷 矩阵 A 作 方差 最 大 正 交 旋转 , 求 出 旋转 后 的 因子 载荷 矩阵 , 仍 记 为 4。 

(9) 计 算 因 子 得 分 。 


四 、 因 子 分 析 的 应 用 实例 


下 边 以 R 型 因子 分 析 为 例 ,介绍 因子 分 析 的 应 用 。 

【 例 4-2】 在 费 北 均 陷 东部 某 烃 源 岩 层 采 得 烃 源 岩 样品 4 个 ,每 个 样品 测 得 三 个 地 化 指 
标 , 共 12 个 原始 数据 ,将 原始 数据 的 各 指标 变量 标准 化 ,得 到 标准 化 数据 阵 X 为 : 
-1.26 -0.96 -0.78 
-0.64 -0.9% -1.14 
0.640 0.580 1.320 
1.260 1.340 0.620 

要 求 对 上 述 标准 化 数据 进行 R 型 因子 分 析 , 考 查 各 指标 变量 间 关 系 ,计算 各 主因 子 的 因 
子 计量 和 因子 贡献 。 

解 :(1) 计 算 三 个 变量 的 相关 系数 矩阵 


X= 








1.00 0.79 0.83 
R=lYX= [o 1.00 oe 
0.83 0.86 1.00. 
(2) 计 算 主因 子 解 
首先 求 得 R 的 特征 值 为 2.77 > 0.20 > 0.03, 方 差 贡 献 的 累计 百分数 分 别 为 0.9233,0.99， 
1.00。 
(3) 确 定 公 因 子 数 m' = 2, 计 算 相 应 的 因子 计量 
R 前 两 个 特征 值 所 对 应 的 特征 向 量 为 如 下 和 矩阵 的 两 个 行 向 量 
(*] „| 0:58 0.59 0.56 
u - 0.47 -0.33 0.83 
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得 到 主因 子 荷载 矩阵 为 
四 van] _ [09% 0.98 0.93 
fl lmu! l-0.21 -0.15 0.37 
(4) 对 各 主因 子 贡献 的 分 析 
由 主因 子 和 荷载 得 到 方差 贡献 分 析 见 表 4 - 4。 由 表 中 的 结果 看 到 ,各 变量 的 公 因 子 方差 都 
比较 大 ,因此 ,用 两 个 公 因子 解释 三 个 变量 能 取得 较 好 效果 ,各 公 因 子 的 方差 贡献 等 于 相应 的 
特征 值 。 第 一 公 因 子 的 方差 贡献 占 总 方差 的 92.3% ,但 各 变量 在 该 公 因子 上 的 载荷 都 很 大 ， 
在 分 别 为 0.96、0.98 和 0.93, 看 不 出 各 个 变量 的 亲 朴 关系 。 故 需要 对 它 进行 旋转 , 求 出 它 的 正 
交 因 子 解 ,然后 进行 分 析 , 下 边 介 绍 有 关 的 分 析 内 容 。 


表 4-4 主因 子 荷载 方差 贡献 分 析 



































因子 变量 a wą xy 方差 贡献 平方 和 
fi 0.96 0.98 0.93 2.71 
| h -0.21 -0.15 0.37 0.20 
| _ 公 因子 方差 平方 和 0.97 0.98 1.0 
(5) 计 算 方差 极 大 正 交 因子 解 


要 计算 方差 极 大 正 交 因子 解 , 即 寻找 适当 的 正 交 变换 矩阵 P, 使 因子 荷载 矩阵 通过 正 交 和 矩 
PE 尸 旋转 后 ,得 到 极 少数 元 素 的 绝对 值 接近 1, 大 多 数 元 素 的 绝对 值 接近 0 的 简单 矩阵 结构 
有 ,而 且 A 和 有 具有 如 下 关系 。 其 中 正 交 变换 矩阵 7 中 的 旋转 角 6, 根据 方差 极 大 准则 (文献 
14) 计 算 。 
cosó sinô] [zn xi xn 
Bopa ae sell a aal 
-| cosb | 0.96 0.98 0.93 
-lsinó cosóll- 0.21 -0.15 0.37 
3 3 
其 中 ,tg40 = yD = 2 - fd) Qxyty)],A = M) (2, - 23), B = 
z 各 
2) pc = Die - x) — (zyj) ] 


由 上 述 关系 计算 得 到 旋转 角 9 = - 69", 相 应 的 正 交 矩阵 为 


| e m BZ - 0.64 
— sinó  cosó. 0.77 
0.87 0.85 4 
B =PA = 
0.45 0.51 0.88 
(6) 计 算 旋转 后 的 因子 计量 F 
-1.6 -0.6 -0. -2. . 
% -0% -0B m _o2n[-288 02 
$ -0.64 -0.% -1.14 -2.@ -0.14|j 0.8 0.23 
F = XAP = 0.8 -0.15 
06 0.8 12 |li oF) 24 027 | -32 3.85 
116 14 0602- ` g 3.10 -0. 
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-1.19 0.2 
-0.29 -1.24 
-0.19 1.59 








1.64 -0.21 
(7) 正 交 因子 解 的 地 质 解释 
从 旋转 后 的 因子 荷载 甜 阵 B = tok Gi M ,对 于 变量 x 和 x 在 第 一 个 主 成 分 
上 的 因子 贡献 较 大 ,而 变量 n 在 第 二 个 主 成 分 上 的 因子 贡献 较 大 ,说 明 烃 源 岩 的 这 三 个 地 化 
指标 反映 了 两 个 不 同 的 烃 成 熟 演化 阶段 。 


另外 ,从 因子 计量 结果 看 到 ,第 一 和 第 四 块 样本 在 第 一 个 主 成 分 上 的 得 分 较 大 ,反映 第 一 
个 主 成 分 代表 的 烃 成 熟 时 期 形成 的 层 段 上 采取 的 ,而 第 二 和 第 三 块 样本 是 在 第 二 个 主 成 分 代 
表 的 烃 成 熟 时 期 形成 的 层 段 上 采取 的 。 若 样本 较 多 且 有 代表 性 ,利用 这 些 样本 的 分 析 结 果 , 可 
以 指导 寻找 不 同时 期 形成 的 油气 储 层 。 


第 三 节 。” 聚 类 分 析 及 其 应 用 


聚 类 分 析 又 称 群 分 析 ,是 一 种 数学 分 类 方法 。 它 起 源 于 分 类 学 ,是 研究 分 类 问题 的 一 种 主 
要 方法 。 自 然 界 中 存在 大 量 的 分 类 问题 ,如 生物 的 分 类 ,经济 发 展 水 平 的 分 类 和 教育 水 平 的 分 
类 等 。 在 地 质 学 中 也 存在 多 种 分 类 问题 ,如 古生物 种 族 分 类 ,油气 圈 闭 的 分 类 和 有 机 质 类 型 的 
分 类 等 。 以 往 解决 分 类 问题 主要 靠 专业 知识 和 经 验 ,但 随 着 科学 技术 的 发 展 , 仅 昔 专业 知识 和 
经 验 已 不 能 适用 于 精细 分 类 和 定量 研究 的 目的 。 

聚 类 分 析 的 基本 思想 是 :首先 认为 所 研究 的 对 象 存在 不 同 的 相似 性 ,根据 样品 各 个 指标 的 
观测 值 , 找 出 一 些 能 够 度量 样品 之 间 相 似 程度 的 统计 量 , 以 此 为 依据 ,把 相似 性 程度 大 的 样品 
聚 为 一 类 ,即将 关系 密切 的 样品 聚合 到 一 个 小 的 分 类 单元 ,关系 疏远 的 又 聚 到 一 个 大 的 分 类 单 
元 ,直到 把 所 有 样品 都 聚合 完毕 ,形成 一 个 由 小 到 大 的 分 类 系统 ,最 后 把 分 类 系统 直观 地 用 图 
形 表示 出 来 ,形成 所 谓 的 谱系 图 或 称 为 取 类 图 。 

根据 分 类 对 象 的 不 同 , 聚 类 分 析 分 为 两 种 。 一 种 是 对 指标 ( 即 变量 ) 进 行 分 类 ,叫做 R 型 
聚 类 分 析 ; 一 种 是 对 样品 进行 分 析 , 叫 做 Q 型 聚 类 分 析 。 

从 聚 类 所 用 的 方法 或 聚 类 选用 的 统计 量 看 , 聚 类 分 析 可 分 为 系统 聚 类 法 、 有 序 聚 类 法 、 动 
态 聚 类 法 和 模糊 聚 类 法 等 ,本 节 仅 介绍 系统 聚 类 法 。 

在 实际 工作 中 ,由 于 样品 多 个 指标 的 观测 值 代表 同一 样品 不 同属 性 的 量 ,这 些 观测 值 可 能 
在 量 纲 和 基 级 上 有 较 大 差别 ,因此 直接 用 原始 数据 进行 计算 ,可 能 会 突出 某 些 基 级 大 的 指标 在 
分 类 中 的 作用 ,压低 甚至 淹没 某 些 小 量 级 指标 的 作用 。 为 此 ,在 聚 类 计算 前 需 对 原始 数据 进行 
变换 。 下 面 从 讨论 数据 变换 方法 开始 ,叙述 到 类 分 析 的 方法 原理 、` 计 算 步 又 和 应 用 实例 。 


一 ,原始 数据 的 变换 方法 


数据 变换 具有 如 下 目的 :(1) 统 一 地 质变 量 的 量 纲 ;(2) 使 地 质变 量 尽 可 能 呈正 态 分 布 ; (3) 
使 地 质变 量 间 的 非 线 性 关系 转化 为 线性 关系 ; (4) 用 一 组 新 的 数量 更 少 的 相互 独立 的 变量 代 
替 原 来 一 组 有 相关 关系 的 地 质变 量 。 常 用 的 数据 变换 方法 ,根据 目的 不 同 又 有 统一 量 纲 的 和 
使 数据 转换 成 正 态 分 布 的 等 多 种 方法 ,这 里 仅 介绍 几 种 统一 量 纲 的 变换 方法 。 
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1. 标 准 化 变换 
Wy (i = 1,2,,n;j = 1,2,',m) (4 - 72) 


式 中 ,i=1,2…,n 为 样品 数 ;j =1， 2 “,m 为 变量 数 ; x 表示 第 j 个 变量 在 第 i 个 样品 中 的 原 
始 观测 值 ; x 为 变换 后 第 j 个 变量 在 第 i 个 样品 中 的 观测 值 ;x 是 第 j 个 变量 的 算术 平均 ;s 是 


NG, - 7 
第 /个 变量 的 标准 差 = 全 一 一 。 
2. 极 差 变换 


šj- 
x, 


式 中 ,xm 是 第 个 变量 的 最 大 值 。xim 是 第 个 变量 的 最 小 值 。 
3. 均 匀 化 变换 (又 称 平均 数 计量 变换 ) 





e (is 1,2,,nij = 1,2m) (4 - 73) 


xyz 
i 
Anin 


xyz Gi = Lr nj = 1,2,4, m) (4 - 74) 
为 了 书写 方便 ,后 边 我 们 仍 用 x 表示 标准 化 变量 。 
二 ,相似 性 统计 量 的 定义 和 计算 


聚 类 分 析 是 以 样品 指标 的 相似 性 程度 进行 的 ,用 何 种 相似 性 度量 作为 相似 性 统计 量 ,关系 到 
聚 类 结果 的 正确 性 和 实际 应 用 的 方便 程度 。 下 面 给 出 常用 的 相似 性 统计 量 的 定义 和 计算 方法 。 

1. 常 用 的 距离 系数 

如 果 把 n 个 样品 看 成 m 维 空间 中 的 n 个 点 , 则 两 个 样品 间 相 似 程度 可 用 m 维 空间 中 两 点 
的 距离 来 度量 , 令 心 ,表示 样品 8 和 5; 的 距离 ,常用 的 距离 有 明 氏 距离 马 氏 距离 和 兰 氏 距离 。 

1) 明 氏 (Minkowski) 距 离 


daD) = (X 1 ay = a 1°)" (4-75) 


ft 


当 g=1 时 , ds.(1) = (> 1 x - x, 1) 为 绝对 距离 ; 


W q=28f, d,.(2) = (X) Cry - x))) ”为 欧 氏 距离 
Ñ q= we 时: di (%) = (mz | xy - xy |) 为 切 比 雪夫 上 次 。 
2) 马 氏 (Mahalanobis) 距 离 


马 氏 距离 是 印度 统计 学 家 马 哈 拉 那 比 斯 于 1936 年 引入 的 , 故 称 为 马 氏 距离 。 设 了 表示 m 
个 指标 的 协 方差 矩阵 


bE E A A (4 - 76) 
HP s 134 -ż)lay-4) (GJ= 12" m) 2, = LS) | 
RZ "HEHE, WI AA BIE PEER 


Ei 
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d.(M) = (X, - X) DY (X, - X,.) (4 - 71) 
RIH, X, = (asza kn) Xe = (zi 向 4, 加)” 分 别 表示 各 个 变量 在 第 i 个 样品 和 
第 ?个 样品 上 的 值 。 
样品 XX 到 总 体 6 的 马 氏 距离 定义 为 : (YX,C) = (X-2)7 X) (X- 2), 其 中 ,为 样品 
的 均值 ， 为 m 个 指标 协 方差 矩阵 。 





3) 兰 氏 (Canbera) 距 离 
由 Lance 和 Williams 最 早 提出 , 故 称 兰 氏 距 离 : 
1A lx 
d (L) = 2 ZER Z (Gi = 1,2,**,n) (4 - 78) 


需要 指出 的 是 , 兰 氏 距 离 仅 适用 于 一 切 x > 0 和 xiy > 0 的 情况 ,这 个 距离 有 助 于 克服 指 
标 间 的 量 纲 影响 ,但 没有 考虑 指标 间 的 相关 关系 。 

2. 相 关系 数 

通常 所 说 的 相关 系数 是 指 变量 问 的 相关 系数 。 设 两 个 指标 在 某 个 样品 上 的 值 用 两 个 向 量 
uj = (aysay ay) May = (zx ivay')7 表 示 , 则 两 个 指标 间 的 相关 系数 为 


HG -ay - 2) 


Cisy <1) (4-79) 





30%, 5, = Dapa = Ay 
样品 间 的 相关 系数 也 可 做 类 似 定义 ， 设 两 个 样品 的 各 个 指标 值 分 别 为 x，= (xa , xa，…， 
X)" Hz = (tisti ,xXiim )” 则 两 个 样品 间 相关 系数 定义 为 


Ds - Ol - že) 
=" 


| SG, - 7 D (ay -a 六 
| jA 


N 
x 


jet 





(GCIs s!) (4 - 80) 


w l 1 
JOW, = mhi = a2 žij o 


三 、 系 统 聚 类 方法 


系统 聚 类 分 析 方 法 是 使 分 类 数 由 多 变 少 的 一 种 方法 。 其 基本 思路 是 首先 认为 各 对 象 自 成 
一 类 ;其 次 ,根据 两 对 象 间 的 相似 性 ,将 最 近 的 两 个 对 象 合并 成 一 类 ;计算 新 类 与 其 余 各 类 的 相 
似 性 , 将 最 近 的 两 类 合并 成 一 类 。 重 复 上 述 步 又 ,直到 所 有 对 象 合并 成 一 类 为 止 。 系 统 聚 类 
分 析 中 常用 的 相似 程度 度量 标准 有 最 短 距离 法 、 最 长 距离 法 和 中 心 距离 法 ,下面 就 这 3 种 方法 
作 一 简单 介绍 。 


1. 最 短 距离 法 
定义 两 类 G, * 6, 之 间 的 距离 为 这 两 类 样品 中 距离 最 近 的 两 个 样品 间 的 距离 , 即 
KO SZA 
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设 类 C, 与 6, 合并 成 一 个 新 类 记 为 6, , 则 任 一 类 C 与 6, 的 距离 


De= _ min dy 
nEaN ec 


= min| min d min da} (4 - 82) 
helea red ea 
= minł De , Dy} 
2. 最 长 距离 法 
定义 类 G, 与 C, 之 间 的 距离 为 两 类 样品 中 最 远 的 两 个 样品 间 的 距离 , 即 
Di = max_ ds. (4 - 83) 
REG NEG 
设 类 6, GG, 合并 成 一 个 新 类 , 记 为 G,, 则 任 一 类 G, 5 6, 的 距离 
Dr = elecd 
= max| max dy, max dy (4 ~ 84) 
med lea ned ea 
= max| Dy , Dy} 
3. 中 间距 离 法 


定义 类 G, 与 C, 之 间 的 距离 既 不 采用 两 类 间 的 最 近 距 离 ,也 不 采用 两 类 间 的 最 远 距离 ,而 
采用 介 于 两 者 间 的 距离 , 故 称 中 间距 离 法 。 


D, = XD, + 十 Ds + BD (4 - 85) 
式 (4-85) 中 , 当 B= -二 时 , D。 就 是 三 角形 的 中 线 。 


四 、 谱 系 图 的 形成 和 应 用 


1. 谱 系 图 的 形成 过 程 

算出 相似 性 统计 量 后 ,就 可 以 它 为 依据 对 样品 或 变量 进行 聚 类 ,最 后 形成 谱系 图 。 聚 合 归 
类 时 要 遵从 如 下 原则 ， 

(1) 若 选 出 的 一 对 样品 在 已 经 分 好 的 组 中 都 没 出 现 过 , 则 把 它们 形成 一 个 独立 的 新 组 ; 

(2) 若 选 出 的 一 对 样品 中 ,有 一 个 出 现在 已 经 分 好 的 组 中 , 则 把 另 一 个 样品 也 加 入 到 该 组 中 ; 

(3) 若 选 出 的 一 对 样品 ,分 别 出 现 在 已 经 分 好 的 组 中 , 则 把 这 两 个 组 合并 ,用 谱系 图 中 的 
线 连 在 一 起 ; 

(4) 车 选 出 的 一 对 样品 出 现在 同一 组 中 , 则 无 需 再 分 组 。 

按 上 述 原则 反复 进行 ,直到 所 有 样品 聚合 分 类 完毕 为 止 。 

2. 一 步 形成 法 

一 步 形成 法 是 一 种 最 简单 的 聚 类 方法 ,计算 量 不 大 。 它 由 相似 性 或 相似 性 矩阵 出 发 得 到 
最 终 的 分 类 结果 。 这 里 仅 就 相似 系数 作为 统计 量 ,介绍 这 个 方法 的 一 般 原 理 : 根据 相关 系数 
的 大 小 ,依次 将 诸 样 品 归 类 联结 起 来 ,形成 一 个 从 小 类 到 大 类 的 分 类 系统 。 依 次 将 相关 系数 最 
大 的 两 个 样品 连结 成 一 类 ,在 连结 的 过 程 中 ,要 遵循 上 述 4 条 原则 。 下 面 用 一 个 例子 说 明 上 述 
思想 的 实现 过 程 。 

【 例 4- 3】 南海 地 区 取得 干 酷 根 样品 6 个 ,每 个 样品 测定 了 6 个 指标 ,分 别 是 类 脂 体 、 壳 
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质 体 、 镜 质 体 、 惰 质 体 H/C 原子 比 和 0 + S/C 原子 比 , 原 始 数据 如 表 4 - 5 所 示 。 现 要 求 对 样品 
进行 分 类 , 即 进行 0 型 聚 类 分 析 。 


表 4-5 南海 地 区 干 酷 根 样品 指标 原始 数据 


















































样品 /指标 类 脂 体 FAE 镜 质 体 情 质 体 H/C 0+SIC 

si | 55 20 25 o 10.0 2.10 
S 25 10 | 40 25 15.2 8.13 
S 15 o s | æ 19.5 10.49 
s, 45 10 40 5 10.1 1.55 
Ss 40 2 40 0 10.0 4.67 
Ss 45 30 25 0 | 9 2.93 

解 : (1) 数 据 变换 

由 于 原始 数据 中 各 指标 量 级 无 多 大 差别 , 故 不 进行 数据 变换 。 

(2) 样 品 间 的 相似 性 统计 量 


用 样品 间 的 相关 系数 作 相似 性 统计 量 ,根据 式 (4 — 80) 算 得 样品 间 的 相似 系数 矩阵 如 下 : 
S, Ss. 8; 8 S; Ss 
1.000 .7524 .5493 .9133 .9519 .9763]51 
1.000 .9549 .8808 .8617 .7471 |S2 
1.000 .7654 .7346 .5505 |S; 
1.000 .9790 .9444 | S, 
1.000 .9434 | S, 
1.000- 5, 
以 下 用 一 步 形成 法 形成 谱系 图 : 
(a) 在 相似 性 统计 量 中 找 出 最 大 值 rs = 0.9790, 将 样品 4 和 5 聚合 为 一 类 ,同时 划 去 R 中 
的 第 5 行 和 第 5 列 , 这 里 采用 的 是 保留 较 小 标号 的 第 4 行 和 第 4 列 ; 
(b) 在 相似 性 统计 量 中 找 出 剩余 的 最 大 值 re = 0.9763, 将 样品 1 和 6 聚合 为 一 类 ,同时 划 
去 R 中 的 第 6 行 和 第 6 列 , 保 留 较 小 标号 的 第 1 行 和 第 150; 
〈e) 在 相似 性 统计 量 中 找 出 剩余 的 最 大 值 rs = 0.9549, 将 样品 2 和 3 聚合 为 一 类 ,同时 划 
去 只 中 的 第 3 行 和 第 3 列 ,保留 较 小 标号 的 第 2 行 和 第 2 列 ; 
相关 系数 10 09 08 07 06 (d) 在 相似 性 统计 量 中 找 出 剩余 的 最 大 值 rs = 
一 0.9133, 将 样品 1 和 4 聚合 为 一 大 类 ,同时 划 去 R P 




















的 第 4 行 和 第 4 列 ,保留 较 小 标号 的 第 1 行 和 第 1 
1— yp 30; 
2 (e) 在 相似 性 统计 量 中 找 出 剩余 的 最 大 值 ro = 
y= 0.7524, 将 样品 1 和 2 聚合 为 一 大 类 ,同时 划 去 R 中 的 
图 4-5 样品 聚 类 (0 型 聚 类 ) 分 析 后 ”第 2 行 和 第 2 列 。 
的 谱系 图 聚 类 过 程 可 总 结 为 表 4 - 6 所 示 的 结果 ,形成 的 
谱系 图 如 图 4-3。 
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3. 多 步 形成 法 基本 原理 和 步骤 
多 步 形成 法 与 一 步 形成 法 基本 步骤 相似 ,唯一 的 区 别 是 每 一 步 分 类 后 ,要 把 分 过 类 的 样品 
值 或 指标 值 合 并 成 为 一 个 新 的 变量 , 即 在 相关 系数 矩阵 R 中 划 出 最 大 的 元 素 ,将 相应 的 变量 
合并 ,赋予 新 的 记号 ,把 合并 的 变量 的 数据 加 权 平 均 作为 新 变量 的 数据 ,再 计算 合并 后 新 变量 
与 其 余 各 变量 的 相关 系数 ,建立 新 的 相关 阵 , 再 进行 下 一 步 分 类 ,重复 这 一 过 程 直到 把 所 有 变 


量 都 合并 为 一 类 。 





与 一 步 形成 法 相 比 ,多 步 形成 法 计算 量 增加 ,但 分 类 的 精度 自然 也 提高 了 。 
下 面 的 实例 展示 了 利用 指标 进行 多 步 分 类 的 实施 过 程 , 即 R 型 聚 类 分 析 。 
【 例 4- 4】 从 某 火山 岩 区 得 到 火山 岩 样品 6 个 ,分 析 测定 6 种 指示 喷发 和 成 岩 环 境 的 6 
种 指示 元 素 的 含量 列 于 表 4 - 7, 试 用 R 型 聚 类 分 析 对 6 种 指示 元 素 进 行 分 类 , 分析 喷发 和 成 
岩 过 程 中 指示 元 素 的 富 集 特征 及 其 地 质 意义 。 


表 4-7 元 素 分 析 的 原始 数据 








联结 顺序 联结 样品 | 相似 系数 | 联结 顺序 | 联结 样品 相似 系数 
1 Se rus 0.9790 4 51,5 84,55 0.9133 | 
2 Si Se 0.9763 5 Sis S6» Sas Ss 82,5; 0.7524 | 
3 Sz S 0.9549 | | 




































































Pr 指标 a | > R m M x 
Sy 2.45 2.35 3.30 2.90 1.90 0.60 

Są 1.90 0.79 | 3.25 j 3.50 | 2.80 1.20 

$y 1.40 0.00 2.70 2.90 T 2.68 0.47 

Sa 2.45 | 2.17 3.45 3.40 | 4.00 1.60 

Ss R 1.95 1.10 3.25 2.00 1.70 0.00 

Se 1.60 0.79 3.10 3.30 2.00 0.65 

解 :(1) 数 据 标准 化 , 标准 化 结果 列 于 表 4-8 中 。 
表 4-8 标准 化 数据 

AR 指标 m | n | » | “u 25 x 
5 1.25 | 1.26 0.53 -0.20 -0.79 -0.30 

Sz -0.15 10.45 F 0.32 | 0.99 0.37 0.87 
53 -1.42 -1.31 T -2.01 -0.20 0.21 -0.55 

Sa 1.25 1.06 1.17 0.79 1.91 1.64 
Ss -0.02 | -0.1 s: 0.32 - 1.99 -1.05 - 1.46 

Se -0.91 | -0.45 -0.32 0.61 -0.6 0.20 











(2) 计 算 指标 间 的 相关 系数 
由 标准 化 数据 ,根据 相关 系数 公式 (4 - 80) 计 算 指标 间 的 相关 系数 矩阵 R 


Xi 32 X3 Xa Xs 
«,[1.00 0.88 0.86 0.06 0.28 
x 1.00 0.75 0.06 0.17 
po a” 1.00 0.12 0.23 
za 1.00 0.61 
xs 1.00 
X6 


Xe 
0.42 
0.33 
0.46 
0.85 
0.87 
1.00. 


找到 最 大 的 相关 系数 ra, =0.88, C ,x2) 合 并 ,建立 新 的 相关 甜 阵 


XyX žy Xy Xs x6 
%%.(1.00 0.86 0.07 0.23 0.40 
xy 1.00 0.12 0.23 0.46 

RÓ = x 1.00 -0.61 0.83 
A 1.00 0.87 
x b 1.00. 


得 到 最 大 相关 系数 7.,,。=0.87, 把 (xs, xs) 合并 ,建立 新 的 相关 矩阵 





AZ Xy Xy XsXe 
xixa[ 1.00 0.86 0.07 0.33 
Re - * 1.00 0.12 0.35 
a4 1.00 0.76 
asx 1.00 


得 到 最 大 相关 系数 ra., = 0.86, 把 (xi ,x,) 与 x 合并 记 为 (xi ,za ,2 ), 建 立新 的 相关 矩阵 





























xi%2x3[ 1.00 0.09 0.35 
RÓ: m | 1.00 on 
sxe 1.00. 
得 到 最 大 相关 系数 rs = 0.76, 把 xs ,xs 与 xs 合并 记 为 (xs , x6,x4) ,建立 新 的 相关 和 矩阵 
asia Mitt, Xstętą 
10 09 0.8 0.7 0,6 0.5 0,4 0.3 0,2 RS PZA 1.00 oz 
Ei 、 1.00. 
5 | 最 后 将 这 两 类 合并 成 一 类 ,其 谱系 图 如 图 4-6 所 示 。 
s 按 上 述 的 相关 系数 ,到 r = 0.75 的 水 平 , 可 将 上 述 指示 
元 素 分 成 两 类 , (xi , mm ) 为 一 类 ,代表 喷发 过 程 的 指示 











JUR, (15,6, ta 
指示 元 素 。 





图 4-6 指标 聚 类 (R ARX) 
分 析 得 到 的 谱系 图 
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) 为 另 一 类 ,代表 火山 岩 成 岩 改造 产生 的 





第 四 节 ”判别 分 析 及 其 应 用 


一 、 判 别 分 析 概 述 


判别 分 析 是 判别 样品 所 属 类 型 的 一 种 统计 方法 。 与 聚 类 分 析 不 同 ,判别 分 析 的 前 提 是 判 
别 的 几 种 类 型 是 已 知 的 ,而 且 每 一 类 型 都 有 一 批 已 知 样品 。 判 别 分 析 的 主要 思想 是 用 统计 方 
法 将 待 判 的 未 知 样品 与 已 知 类 型 的 样品 进行 类 比 ,以 确定 待 判 样品 应 归属 于 哪 一 类 。 

石油 与 天 然 气 地 质 中 有 大 量 判别 类 型 的 问题 ,如 判别 岩石 类 型 ,地层 年 代 ZEW i 
遇 地 层 的 含油 气 性 的 好 坏 沉积 相 类 型 和 生 油条 件 的 优 劣 等 。 因 此 ,在 石油 地 质 学 中 判别 分 析 
有 着 广泛 的 应 用 。 最 简单 的 情形 下 , 单 就 一 个 变量 的 值 就 可 区 分 不 同 的 类 , 见 图 4- 7(a)。 但 
通常 情况 下 , 单 就 一 个 变量 难于 区 分 不 同 的 类 ,如 图 4- 7(b); 只 有 利用 多 个 变量 ,才能 比较 全 
面 地 从 各 个 不 同 的 角度 刻画 各 母体 间 的 差异 。 

实际 工作 中 ,由 于 各 个 变量 间 的 关系 错 
综 复杂 , 赁 简单 的 逻辑 思考 进行 直观 推断 ， 
不 能 充分 合理 地 利用 它们 所 提供 的 分 类 依 
据 。 下 面 介绍 的 判别 分 析 方法 就 是 为 解决 
这 个 矛盾 ,用 适当 的 数学 方法 从 多 个 变量 中 
提出 有 关 判 别 分 类 的 有 效 信息 ,综合 成 一 个 
像 单 变量 那样 好 用 的 判别 标准 。 下 面 以 两 
组 判别 为 例 ,说 明 判别 分 析 的 思想 。 

设 某 区 域内 存在 含 矿 和 不 含 矿 的 两 组 
岩 体 , 若 把 含 矿 岩 体 的 总 体 记 为 4 ,不 含 矿 岩 体 的 总 体 记 为 4 , 现 分 别 从 A, 和 A 两 类 总 体 
中 个 取 一 批 样品 , 测 出 样品 中 能 反映 含 矿 特征 的 一 些 指标 ,从 所 测 得 的 数据 看 , A, 和 A, 的 样 
品 数据 是 有 区 别 的 ,但 也 有 一 部 分 是 相互 重 全 的。 那么 ,是 否 可 由 这 各 个 指标 综合 出 一 个 新 的 
指标 ,使 得 4, 和 A, 在 综合 指标 上 有 明显 的 区 别 ? 若 可 以 , 当 
取得 新 的 样品 时 , 便 可 以 由 新 样品 的 综合 指标 来 判别 它 属于 
A, 或 属于 4,。 事 实 上 ,这 样 的 指标 对 大 多 数 问 题 是 可 以 找到 
的 。 下 面 只 用 简单 的 两 组 判别 问题 为 例 ,以 图 4 - 8 的 几何 图 
形 加 以 说 明 。 

设 对 A, 和 A, 观测 了 两 个 指标 x, 和 x. ,两 个 椭圆 分 布 分 
别 是 A, 组 和 A, 组 样品 测 得 的 指标 的 分 布 ,从 图 4 - 8 可 见 ,如 
果 用 单一 的 指标 , 则 A 组 和 4, 组 的 指标 分 布 有 较 大 的 重奏 ， 

图 4-8 双 变 量 判 别 分 析 。 但 如 果 经 过 原点 作 一 适当 的 直线 ,如 式 (4 - 86) 所 示 , 将 指标 分 

的 示意 图 布 投影 到 该 直线 上 , 则 在 该 直线 上 A 和 A, 两 组 的 指标 的 重 又 
部 分 将 小 于 其 它 任何 方向 的 直线 上 的 投影 。 为 便于 看 清 ,图 4 - 6 中 用 的 是 该 直线 的 平行 线 上 
的 投影 来 说 明 问题 。 过 原点 直线 的 方程 由 两 个 指标 x, 和 x 的 线性 组 合 构成 , 即 


2 
z = ct, + erm = D) eji (4 — 86) 


fei 








图 4-7 单 变量 判别 分 析 的 示意 图 
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式 中 ,z 是 综合 x, 和 x, 两 个 指标 的 一 个 综合 指标 , 称 为 判别 函数 ,c, 和 c, 为 判别 系数 。 

由 于 判别 函数 是 一 个 线性 函数 ,通常 称 为 线性 判别 函数 。 该 函数 将 平面 分 成 两 个 不 相交 
的 区 域 , 即 cix, + caxa > zo 和 cja, + caxa < zo ,从 而 能 有 效 地 区 分 两 组 样品 。 

除了 线性 判别 函数 外 ,还 有 非 线性 判别 函数 。 实 际 工作 中 , 可 用 不 同 的 原则 建立 判别 函 
数 ,常用 的 判别 函数 有 距离 判别 函数 、 费 软 尔 判别 函数 和 贝 叶 斯 判别 函数 。 我 们 可 根据 未 知 样 
品 的 指标 和 分 类 性 质 ,选用 合适 的 判别 函数 。 下 面 仅 介绍 费 软 尔 判 别 和 贝 叶 斯 判别 的 方法 原 
理 和 实现 过 程 。 


二 、 费 歇 尔 准则 下 的 两 组 判别 


ILE 

最 为 简单 的 判别 分 析 问题 是 两 组 判别 问题 ,如 在 砂 体 存在 和 不 存在 的 样品 类 属 间 判别 、 在 
含 矿 和 不 含 矿 间 的 样品 类 属 间 判 别 以 及 在 含油 气 和 不 含油 气 圈 闭 间 的 判别 等 。 

设 有 两 个 总 体 分 别 记 为 4, 和 4;, 它 们 的 样品 数 分 别 为 n, 和 m , 测 得 的 指标 个 数 为 m， 
则 两 类 样品 的 数据 可 由 如 下 两 个 数据 阵 表示 


Xu(A,) xna(h) … xin(4i) 
mów sad, 4 zalt (46) 

KACA. CA 4,,(A) 

xu(A2) xu(A2) … xn(42) 
4, = „e PUR R koi Z) 

CA, aC 5, „(A) 

设 区 分 这 两 个 样品 类 属 所 求 得 的 判别 函数 为 

Z = cixi + Cata 十 … + Cam Z Ss (4 - 89) 
这 相当 于 在 m 维 空间 中 ,用 m- 1 维 超 平面 将 两 组 样品 区 分 开 来。 求 式 (4 - 89) 中 的 判别 


系数 是 求 判 别 函数 的 关键 。 
根据 上 述 两 组 判别 函数 ,可 以 得 到 A, 和 A, 两 组 数据 的 均值 和 相应 的 离散 度 , 即 
A, 组 的 组 内 均值 


ż(A,) = > cz(4i) ,天 (4) = Daad = 1,2, ,m) (4 - 90a) 
j 1 i=1 
A, 组 的 组 内 均值 


KAD = DAMDE) = ED ADG = 12m) (4-900) 


j= 


两 组 的 离散 度 分 别 为 


D(A) = 六 [za(4) - 2(4,)] (4 - 9la) 
a 

D(A,) = D [z (4) - ż(4,)] (4 - 91b) 
rz) 
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式 中 , z,(4,) = Żem, (ADC = 1,2,***,n,);2,(4;) = 27 (A: )G = 1,2,**,n,) o 


根据 判别 分 析 的 思想 ， 我 们 要 使 两 组 的 重 得 部 分 尽 可 能 小 ， 则 要 求 z 的 值 在 两 组 间 的 差 尽 
可 能 大 ,各 组 内 的 离散 度 尽 可 能 小 ,这 就 是 费 软 尔 判别 准则 。 
两 组 的 差异 可 表示 为 
Q = [5(4) - ż(4,)] (4 - 92) 
而 两 组 内 部 的 离散 度 可 表示 为 


= Slaa - (A0P + Sial) -ah (4 - 93) 
BESNKÓRYENU ,应 确定 系数 c,,c,,…, cn 使 7= 用 达到 极 大 。 
2. 判 别 系数 的 确定 
根据 极 值 计算 原理 ,要 使 = 有 达到 极 大 , 即 要 求 7 对 判别 系数 c ,c: ,… ,cv 的 一 阶 导数 


为 0, 亦 即 要 求 六 =0 (j=1,2,…,m) ,下面 具体 导出 系数 的 计算 关系 式 


a0 aF 

al def 7 030 

er o =0 (4 - 94) 
20r - 937 oF - 190 

de” = A Pag = T de (8 -%) 


下 面 将 1.0 AF 的 关系 式 代入 式 (4-95) 的 右 端 和 左 端 项 ,并 将 未 知 数 的 下 标 j 换 成 站 得 
2 5 呈 m 
2E -2)) DX 02,4) -BADIM (A) - 2,040] 


j mmi y 


2 "e 
=2) c] DPA) -sa (A) -2,(40]) 4-9% 


Fak 


=25 we (= 1,2, ,m) 
A 


2 % 
RP, wy = D Dll) - ż(4,)JL2,-(4,) - ż,.(4,)]. 


ELETI 


将 A, 组 的 均值 和 A, 组 的 均值 代入 式 (4- 92) 得 
=2{ Ñ ala4) - (AJIJE.(A,) - ż,(4)] 
i 


m (4 - 97) 
=2( Dod)d (= 1,2,*,m) 
A 
式 中 ,dj = [ż,(A,) - ż,(4,)] 。 
将 式 (4- %) „(4 -97) 代 和 方程 (4 - 95) 得 
Dod, 
22) wje, = 24p—d,(J' = 1,2, sm) (4 — 98) 


车 ireas s Cn 是 这 一 方程 组 的 解 , 则 对 任意 常数 a 40, ac, acz," „ac, 也 是 它 的 一 组 
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Z osa, 
解 ,我 们 可 以 取 适 当 的 az0, 使 二 了 一 = 1 ,从 而 通过 求 下 面 的 方程 组 求 取 判别 系数 


PDZ =d; (f=1,2,*,m) (4 - 99) 
简写 成 拒 阵 形 式 为 
KC:= 9 (4 ~ 100) 
Wy wą Wim 
式 中 ,WW = | "r "a "ix | ,系数 矩阵 W 称 为 m PERAR ERE: 
Wn W sa Wm 
D=[d, d, ** dp], C= [e Ga … eal’o 


求 取 了 判别 系数 , 即 得 到 了 式 (4- 89) 的 判别 函数 ,将 未 知 类 的 样品 值 代 人 判别 函数 即 可 
实现 对 未 知 类 的 判别 。 
3. 判 别 规则 和 判别 效果 检验 
求 取 判 别 函数 后 ,可 以 用 公式 (4- 90) 计 算出 组 内 平均 并 确定 判别 指标 ,具体 可 以 采用 如 
下 两 种 方法 ， 
(1) 由 各 组 样品 数 m » na „JBL zo A 2, F z, 的 加 权 平均 , 即 计算 判别 函数 的 总 平均 
n = Miti = Hl Aaa) Daa] (4 - 101) 
(2) 求 取 两 类 均值 之 间 的 欧 氏 距离 。 
用 上 面 的 方法 确定 的 判别 函数 , 当 n,n 较 大 时 , 受 样品 数 影响 较 大 ,往往 出 现 偏差 。 
上 面 分 析 的 判别 方法 只 考虑 了 两 组 样品 确 有 差异 的 情形 。 若 两 组 样品 没有 差异 ,那么 上 
述 讨论 就 失去 了 意义 。 在 实际 工作 中 ,还 需要 判别 研究 的 两 组 是 否 真有 差异 。 显 然 要 进行 样 
品 差异 的 显著 性 检验 。 我 们 知道 ,向 量 D = [d， d … da)” 反映 两 类 之 间 的 差异 。 为 了 
度量 这 个 差异 的 大 小 ,这 里 采用 两 组 均值 之 间 的 欧 氏 距离 
D'D = Żyd = ŻA) - 3,(4, ) 了 (4 - 102) 
在 式 (4 102) 中 ,没有 考虑 变量 间 的 相关 性 ,而 把 各 变量 同等 对 待 , 有些 情 况 下 与 实际 数 
据 特 性 不 符 。 


为 消除 变量 间 相 关 性 的 影响 , 需 采 用 马 哈 拉 诺 比 斯 (Mahalanobis) 广 义 距离 的 概念 来 度量 
组 间 的 差异 。 回 顾 上 一 节 介 绍 的 马 氏 距离 的 定义 ,首先 计算 变量 间 的 协 方差 


SS. (A,) - zp (Ap) JECA) - ż,(4,)] 
pI (4 - 103) 


wp (jf = 1,2,**,m) 





= 


sain 
=n-2 


AF ,n=n, + mo 
m 个 变量 的 协 方差 矩阵 定义 为 
S = [sp laa = ZWS" = (n -207 (4 - 104) 
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一 般 地 ,S 和 3-:! 都 为 正定 ,两 类 均值 的 马 氏 距 离 可 定义 为 如 下 的 二 次 形 





D, = D'S'D (4 - 105) 
式 中 ,DD 表示 马 氏 距离 。 
利用 马 氏 距离 进行 检验 的 统计 量 可 定义 为 
F= 2-m-l mm D, (4 ~ 106) 


m X n(n - 2) 

当 两 组 样品 的 均值 相等 时 , 它 服从 自由 度 为 (m,n - m -1) 的 下 分 布 ,用 它 可 检验 两 组 的 
均值 是 否 存在 差异 。 

4. 实 例 分 析 

【 例 4-5] 现 有 表 4-9 所 示 的 若干 个 油层 和 水 层 的 样品 的 4 个 指标 : 岩 性 系数 (x,)、 和 孔隙 
度 (x,)、 侵 人 系数 (x,) 和 含油 气 饱 和 度 (x。), 若 油层 为 A 组 ,水 层 为 4,, 现 要 求 根据 表 中 的 数 
据 建立 两 组 的 判别 函数 并 检验 其 有 效 性 。 

表 4-9 油层 和 水 层 样 品 指标 










































































油层 u n 23 u z 
1 0.276 0.18 0.446 0.683 11.60 
2 |-- 0.378 0.20 0.746 0.673 8.05 
3 0.325 0.20 0.800 0.633 1.75 
4 0.138 0.21 0.750 0.728 15.09 
5 0.290 0.24 0.870 0.649 1.43 
6 0.270 0.19 1.730 0.613 8.51 
7 0.450 0.3 2.660 0.544 0.07 
8 0.302 0.3 1.780 0.590 5.27 
9 0.344 0.234 3.400 0.618 4.67 
10 0.358 | 0.21 1.370 0.619 5.98 
u 0.076 0.26 0.850 0.733 14.59 
12 0.346 0.27 1.320 0.621 3.85 
13 0.186 0.30 0.560 0.796 12.85 
水 层 KJ n x a z 
1 0.62 0.24 6.22 0.544 -4.78 
2 0.61 0.25 1.42 0.494 -6.01 
3 0.62 0.27 1.46 0.510 -6.47 
4 0.56 0.13 1.30 0.372 -4.43 
$ 0.43 0.22 0.90 0.214 -10.85 
6 0.47 0.20 | 2.90 0.220 - 11.20 
z 0.56 0.20 3.00 0.221 - 13.21 
8 0.29 0.25 4.66 0.395 -3.01 
9 0.30 0.2 3.18 0.250 -1.17 
10 0.35 0.19 17.90 0.230 -10.19 
U 9.27 0.25 8.70 0.145 -12.50 





























解 :(1) 计 算 各 组 指标 的 平均 值 和 均值 差 
ż,(A,) = 0.2876,ż,(4,) = 0.2278,ż,(4,) = 1.3294,z4(A1) = 0.6538, 
*,(4,) = 0.4618,2,(4,) = 0.2195,2,(4,) = 4.6945,ż,(4,) = 0.3268, 
d, = - 0.1742,d, = 0.0083,d, = - 3.3651,d, = 0.327 
(2) 计 算 两 组 的 综合 协 方差 矩阵 并 形成 方程 组 
由 方程 (4 - 103) 计 算得 到 的 综合 协 方差 矩阵 为 
0.0147 -0.0006 -0.1209 0.0030; 
-0.0006 0.0013 -0.0004 0.0013 
-0.1209 -0.0004 11.7019 -0.1153 
0.0030 0.0013 -0.1153 0.0115 


得 到 方程 组 为 
WC = D 
RH, C = [c,,62,05,04]7,D = [dy,d,d,,d,]7- 
(3) 解 上 述 方程 组 
c, = — 22.5698, c, = — 41.3115, c, = -0.17016,c =37.1 
从 而 ,判别 函数 为 


z= -22.5698x, — 41.31152, ~ 0.170162; + 37. 1x4 
(4) 计 算 各 组 判别 函数 的 平均 值 和 判别 指标 


z(A,) = Dala, ) = 8.1307,ż(4,) = Bat) = - 8.1667 


名 
= 13 x 8.1307 + 11 x (-8. 1667) 





= 0.661 
3+ 11 
(5) 计 算 马 氏 距 离 和 统计 量 F 
DY, = Med, = 16.30 
13x11 13+11-4-1 
F = 34 (13 + 11-2) * 4 S00 


在 a =0.05 的 显著 性 水 平 下 , 查 附 表 4 得 Fo ws(4,19) =3.56。 
Kl F> Fows(4,19) ,显然 判别 函数 是 高 度 显著 的 。 
在 上 例 中 加 入 表 4 - 10 中 的 样品 后 ,用 费 软 尔 准则 进行 两 组 判别 ,判别 过 程 如 下 : 


34-10 油水 屋 样品 指标 表 
































样品 x | wą x x 
1 0.36 0.19 3.8 0.56 
2 + 0.42 0.14 0.84 | 0.54 
3 0.36 0.29 4.20 0.50 
4 0.35 0.17 3.18 0.61 
5 0.32 0.30 5.20 | 0.62 
6 0.52 0.27 | 3.00 0.58 
7 0.61 0.18 1.20 0.59 
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a-. 新 样品 的 判别 函数 值 为 
z =4.16; mm =4.6; 2 =-2.27 
z =7.17; z=2.50; zs =-1.88; z = 0.48 
b. 根 据 新 样品 的 判别 函数 值 与 判别 指标 的 关系 ,确定 各 新 样品 的 归属 。 
判别 函数 大 于 z = 0.661 的 样品 有 1 号 .2 号 .4 号 和 5 号 4 个 样品 , 故 这 4 个 样品 应 归 人 
到 油层 。 
判别 函数 小 于 z = 0.661 的 样品 有 3 号 .6 号 和 7 号 3 个 样品 , 故 这 3 个 样品 应 归 和 人 到 水 


三 、 贝 叶 斯 准则 下 的 多 组 判别 


前 面 介绍 了 两 组 判别 方法 ,但 在 实际 工作 中 往往 会 遇 到 多 组 判别 的 问题 ,如 油气 储 层 研究 
中 油气 ,油气 水 同 层 和 水 层 的 问题 ;根据 岩石 地 球 化 学 资料 判别 多 个 沉积 环境 的 问题 等 ,下 面 
介绍 在 贝 叶 斯 判别 准则 下 的 多 组 判别 。 

1. 贝 叶 斯 判别 准则 

设 有 上 个 组 4 „4270 A JP g 个 组 取得 的 样品 个 数 为 m(& =1,2,…,k) ,每 个 样品 
都 观测 了 m 个 指标 ,用 x (A ) 表 示 第 g 组 第 i 个 样品 的 第 j 项 指标 的 观测 值 , 即 这 个 组 的 
观测 数据 可 用 如 下 的 数据 阵 表示 


「 xn(4) xn(4) … xm(4i)] 
ta(4) xz(4) … xzan(4i) 

A, = f A : A (4 - 107a) 
La (A) 2304) … aCA) 
xu(A2) xal) … 2(4,)] 
Xu(A2) xz(4) … tan(42) 

A = : A A £ (4 - 107b) 
Lzea(Az) za(Az) … tna (Aa) 
xn)  za(4,) … 21(4,)] 
xa(Ai) Zn(A,) © zm(4,) 

A, = A i ; : (4 - 107e) 
xA(A) xua(4) … x(4,) | 








现 有 一 新 样品 了 来 自 上 述 几 个 组 中 的 某 一 个 ,其 m 项 指标 为 y, „717,7, MRI Y= (y1, 
7 Yn ) 表 示 , 判 别 分 析 要 解决 的 问题 是 将 了 归于 上 述 的 哪 一 组 。 
在 贝 叶 斯 意义 下 建立 判别 模型 ,是 要 计算 了 属于 各 组 的 概率 ,然后 比较 PIUY| ,PIZ/Y|, 
…,Pik/Y1} 的 大 小 ,最 后 将 Y 归于 概率 最 大 的 那 一 组 。 
根据 贝 叶 斯 公式 ,样品 了 属于 第 g 组 的 概率 Pig/Y| 为 
Pigli = OWY) (go 1,2,0) (4 — 108) 


T 


Dahiya Yn) 
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RP, 产 (7 ,ya,…，yn) 是 样品 了 属于 第 & 组 的 概率 密度 ; ge 为 第 g 组 的 先 验 概率 ,在 实际 工 
作 中 常用 样本 的 频率 作为 它 的 估计 值 。 


qe = ns/N (NN 为 全 部 样品 数 ,N = mo (4 - 109) 
下 面 就 样本 是 正 态 分 布 时 的 情况 讨论 YATE g 组 的 概率 Pig/Y| 的 计算 问题 。 
2. 样 品 为 正 态 分 布 时 的 线性 判别 函数 计算 
BŁ 不 组 样品 服从 正 态 分 布 , 其 中 第 g 个 组 的 均值 为 X, 向 量 , 协 方差 矩阵 为 S, ,于 是 其 概 
率 密度 为 
15.7 


Gitar tn) = eire -TK -XYSIA -X)| (g=12k)  (4-1w) 
9 2 


RP, X, 是 第 5 组 m 个 样品 上 的 m 个 指标 组 成 的 数据 阵 刺 = (aj aga XM) = 


Gape SE, = CM G=TO 是 均值 向 量 ,再 = LYA) S, = 





Sh Sh o St. 
SS “路 apase s = LOS aCA) -Hay (4) FL]. 
Sm Sh …  Smm 
对 于 各 协 方差 函数 相等 的 情况 ,用 5 代替 5, , 式 (4 - 110a) 变 为 
ca = = 
flar 2.) = tamel -70,-%)8'0,-F,)] 
(g=1,2,**k) (4 - 110b) 


将 式 (4 - 110a) 代 入 式 (4- 108) 得 
qol- F -oS - X,)] 
PiglY| = 一 (4- 111) 
Dael- 4 - Xs - XV] 
各 





利用 上 述 公式 即 可 计算 样品 了 属于 各 组 的 概率 ,然而 我 们 关心 的 是 哪个 最 大 ,由 上 式 可 
以 看 到 分 子 达到 最 大 即 可 , 下面 仅 对 分 子 项 进行 分 析 。 不 妨 对 分 子 取 对 数 


Iin{ grexp[ = 二 7- "sr } 
= Ing, - 4 (Y - X,)'S”"(Y- X,) (4 — 112) 
= Inq, - PLYSTY - JS 元 - XS" Y + XS" X,] 
将 上 式 中 与 g 有 关 的 项 记 作 F,(Y) , 即 
F(Y) = Ing + ZYS"R, + EXIS Y- LRĄS"X, (e = 1,20%,k) (4 — 113) 


从 公式 (4 - 113) JU BEI, F, (了 Y) 是 y,,y,,…y。 的 线性 函数 ,显然 F, DRAKE, 
Pig/ 了 站 也 达到 极 大 ,样品 Y 就 属于 那 一 组 , 称 F,(Y) 为 判别 函数 。 
对 于 多 个 变量 的 判别 效果 检验 ,请 感 兴趣 的 读者 参考 相关 文献 。 
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四 、 逐 步 判 别 分 析 


在 判别 分 析 中 ,人 们 希望 用 尽 可 能 多 的 变量 构造 判别 函数 ,使 之 能 包含 尽 可 能 多 的 与 判别 
分 组 有 关 的 信息 。 和 前 面 分 析 的 回归 分 析 方法 一 样 , 若 包含 过 多 的 变量 ,有 时 反而 会 使 判别 效 
果 变 坏 。 其 原因 是 ,在 求 判 别 函数 时 需 对 协 方差 矩阵 SRA, 若 包含 的 变量 太 多 ，5 求 逆 的 
计算 精度 较 差 。 特 别 是 当 所 含 变量 接近 线性 相关 时 ，5 接近 降 秩 矩阵 , 求 逆 结 果 极 不 稳定 , 判 
别 效果 会 很 差 。 因 此 也 要 像 逐 步 回归 那样 ,在 可 供 选 择 的 诸多 变量 中 选择 判别 能 力 强 的 变量 ， 
剔除 判别 能 力 弱 的 变量 ,这 就 是 逐步 判别 分 析 的 思想 。 下 面 还 是 以 式 (4 - 107) 中 的 样品 数据 
为 出 发 点 介绍 逐步 判别 分 析 的 计算 步 又 。 

1. 离 差 矩 阵 和 Wilks 统计 量 计算 

2 


HAREE W = [uj Juma = DD AD) -FAD DA) - 3. (4,)] 


ARRE B = lbp J b, - ża CA - 24] * [xy-(4,) - 2,.(4,)] 
名 


总 离 差 矩阵 7 = [tj lmnt = wje + by 


其 中 , žy = 1% PORZE a 1 DER =1,2,mij = 1,2,:,m),N = ni +m+ 
+ ny JU Wilks ŚESPIŁASKEBE W 和 了 的 行列 式 值 之 比 得 到 , 记 为 U 
U=IWI/ITI (4 - 114) 
2. 逐 步 筛选 变量 
设 已 计算 了 步 ,在 判别 式 中 引入 了 1 个 变量 , 则 在 第 (L+1) 步 的 计算 内 容 如 下 : 
(1) 计 算 全 部 变量 的 判别 检验 量 , 对 已 选 人 的 变量 w 和 未 和 人选 的 变量 x 分别 计 算 
U, = Pn? 


U = wj, 


(2) 在 已 人 选 的 变量 中 ,考察 是 否 有 判别 能 力 不 显 著 的 变量 ,这 时 可 在 U, 中 找 出 最 大 者 
( 即 对 应 判别 力 最 差 的 变量 ) , 若 以 = max| U, | „FE FF 检验 ,计算 


W _ (w 
poz mole Nom-l+l 
= "w ATI 


(4 - 115) 





(4 - 116) 


如 果 F,<Fa(m-1,N-m-1-1)8$ F, > F,.a(m-1,N-m- 1-1) IWIAŻYZE a tÈ 
验 水 平 下 ,x, (00 5AE0 75 522 „A GBABR x, , 转 到 第 3 步 。 

# F,>Fn(m-1,N-m-1-1)5% F,<F,-n(m-1,N-m-1-1),WIAYWZE a 检验 
KPF, x, 的 判别 能 力 显著 ,从 而 保留 x, ,然后 转 而 考察 未 选 人 变量 中 的 其 它 变量 是 否 还 有 判 
别 能 力 显著 的 变量 未 被 选 人 判别 函数 。 为 此 ,对 未 被 选 人 的 变量 找 出 以: 中 的 最 小 者 , 它 对 应 
判别 能 力 最 强 的 变量 。 若 U, = min| U, | , 据 此 计算 F, 统计 量 

R 19 zyć g N-m_l 

车 > Fa(m-1,N- m- I)EŻ F,ZF,-p(m-1,N- m- 1), WAKE a 检验 水 平 下 ， 
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(4 - 117) 





x, 的 判别 能 力 显著 ,从 而 将 x, 引入 到 判别 函数 , 转 到 第 3 步 。 若 F,zFa(m-1,N-m- 1) 
或 > Fsn(m -1,N-m-1/), 则 ,的 判别 能 力 不 足 ,没有 变量 可 再 引入 判别 函数 了 。 重 


复 以 上 计算 ,直到 再 没有 可 被 引入 的 变量 为 止 ,筛选 变量 环节 结束 。 
3.3EE 取 和 了 的 变换 公式 
在 第 L + 1 步 对 矩阵 WATEKE r 列 的 变换 公式 如 下 : 


wy lwy” (j=r #7) 
W_ WWW ç; r 
am _ | -w wy lwvż (jarj ær) 
w; yć (L) A z 
Uw, G=rj =r) 
- wę lwy Gær =r) 
WR G=rj zn 
WWW, W g; s 
KO tę -tj lty lwy (jźrj ær) 
f P G=rj=n 
- ay Gźrj=n 


令 思 考 和 练习 题 令 


1. 什 么 是 趋势 分 析 ? 试 述 其 计算 步 又。 


2. 趋 势 面 分析 在 石油 和 天 然 气 地质 中 有 哪些 应 用 ? 在 应 用 时 应 注意 哪些 问题 ? 


3 .为 什么 作 聚 类 分 析 时 要 进行 原始 数据 变换 ? 常用 的 变换 有 哪 几 种 ? 


4. 常 用 的 相似 性 统计 量 有 哪些 ? 它们 如 何 刻画 变量 和 样品 间 的 亲 琉 关 系 ? 


5. 主 成 分 分 析 的 几何 意义 是 什么 ? 写 出 主 成 分 分 析 的 计算 步骤 。 
6. 常 用 的 判别 分 析 有 哪 几 类 ? 叙述 贝 叶 斯 判别 准则 的 基本 思想 。 
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GH ”随机 函数 及 其 结构 分 析 


本 章 学 习 目 的 和 要 求 :理解 随机 函数 、 随 机 过 程 和 区 域 化 变量 概念 的 内 活 , 掌 握 
结构 分 析 的 工具 一 一 相关 图 和 变 差 函数 及 变 差 函数 的 计算 、 拟 合 和 套 合 ,为 第 六 和 第 
七 章 的 学 习 莫 定 理论 基础 。 本 章 内 容 的 学 习 需 以 第 二 章 的 内 容 为 基础 


第 一 节 ”随机 函数 的 定义 及 其 研究 意义 


一 、 随 机 函数 的 定义 


在 第 二 章 中 ,我 们 介绍 了 随机 变量 和 n 维 随机 向 量 的 概念 , 当 把 n 维 随机 向 量 理解 为 “ 同 
-属性 的 变量 在 不 同 点 上 "时 ,n 维 随机 向 量 就 是 一 个 随机 函数 ,可 称 作 空间 和 /或 时 间 上 相关 

的 一 组 随机 变量 。 

随机 函数 在 一 维 时 间 轴 上 称 为 随机 过 程 , 记 为 ZC), e 为 时 间 轴 ;在 空间 域 中 称 为 随机 
场 , 记 为 Z(x),x 为 空间 位 置 。 若 把 时 间 和 空间 问题 结合 起 来 ,就 构成 一 个 时 空 模型 , 记 为 
Z(x,t)o 

电场 ,磁场 ,重力 场 和 温度 场 等 都 是 空间 点 的 函数 , 且 它 们 也 都 有 随机 性 的 变化 , 故 都 可 看 
成 随机 场 。 对 随机 场 每 次 观测 的 结果 ,都 得 到 一 个 确定 的 空间 点 函数 ( 即 实现 ,realization) ,而 
当 我 们 对 空间 某 个 点 xo 来 考察 随机 场 时 , 则 得 到 一 个 随机 变量 Z(xo)。 

以 上 是 关于 随机 函数 的 直观 理解 ,下 面 我 们 从 随机 试验 出 发 ,来 定义 随机 函数 : 

设 随 机 试验 E 的 样本 空间 为 2 = |o|, 若 对 每 一 个 。€ 0 ,都 有 一 个 函数 Z(xi, x，…， 
anro) (a EX, EX E X ) 与 之 对 应 , 且 当 各 自 变量 X, ,X,,…,X, 均 取 任 一 固定 值 
时 ,函数 ZC aisar ,x, ,wm) 为 一 随机 变量 , 则 称 Z(x ,x,,… ,x, ETES X „X, XE 
的 随机 函数 , 记 为 Z(x)。 

根据 以 上 定义 来 理解 ,随机 函数 Z(x) 既 可 看 作 是 无 穷 多 个 实现 的 组 合 ; 也 可 看 成 在 时 间 
上 或 空间 上 相关 的 一 组 随机 变量 ,x 代表 空间 位 置 。 


二 、 随 机 函数 研究 的 意义 


经 典 统计 学 方法 是 基于 以 下 几 个 基本 假设 进行 各 种 分 析 的 :中 变量 与 空间 和 /或 时 间 无 关 ; 
@ 研 究 对 象 是 纯 随机 的 ;@ 可 以 无 限 重复 随机 试验 ,进行 大 量 观 测 ;@ 每 次 抽样 都 是 独立 的 。 

从 经 典 统计 学 方法 的 几 个 假设 来 看 ,其 适用 范围 主要 限制 在 对 人 为 随机 试验 结果 的 分 析 
上 。 然 而 ,地 质变 量 是 在 空间 和 /或 时 间 上 展 布 的 变量 ,这 些 变量 在 空间 和 /或 时 间 上 有 一 定 的 
位 置 , 一 般 来 说 具有 相关 性 或 结构 性 ,而 不 是 纯 随机 的 ;另外 ,对 一 个 样品 点 取样 ,只 能 取 一 次 ， 
而 不 能 进行 无 限 重复 取样 。 在 地 质变 量 研究 中 直接 引入 经 典 的 概率 统计 方法 ,就 会 遇 到 困难 。 

传统 的 概率 论 .数理 统计 及 多 元 统计 学 方法 不 能 考虑 空间 和 /或 时 间 上 展 布 的 变量 中 的 结 
构 性 信息 ,从 而 难以 合理 地 表征 这 些 在 空间 和 /或 时 间 上 具有 结构 性 的 变量 。 

20 世 纪 60 年 代 以 来 , 随 着 人 类 对 各 种 自然 和 社会 现象 随时 间 演 化 规律 的 兴趣 和 社会 发 
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展 对 预测 的 需要 ,时 间 序 列 分 析 预 测 方法 得 到 了 长 足 的 发 展 ,该 方法 旨 在 根据 变量 过 去 的 观测 
值 ,利用 其 中 所 包含 的 结构 性 信息 建立 模型 ,以 达到 对 变量 未 来 可 能 出 现 的 值 进行 预测 的 目 
的 ,在 众多 领域 中 ,尤其 在 经 济 学 研究 的 领域 中 ,该 方法 得 到 了 广泛 的 应 用 。 

20 世纪 70 年 代 诞生 的 《地 质 统计 学 》, 可 以 更 好 地 反映 变量 的 空间 结构 性 和 变量 值 的 变 
化 。《 地 质 统计 学 ?已 成 为 以 变 差 函数 为 基本 工具 ,在 研究 区 域 化 变量 的 空间 分 布 结 构 特征 规 
律 性 的 基础 上 ,选择 各 种 合适 的 克 立 金 法 ,以 达到 更 精确 地 估计 或 对 区 域 化 变量 进行 随机 模拟 
为 主要 目的 的 一 门 数 学 地 质 独立 分 支 学 科 。 

事实 上 ,在 时 间 序列 分 析 预 测 中 的 随机 过 程 ,就 是 在 一 维 时 间 轴 上 展 布 的 随机 函数 ,而 在 
地 质 统计 学 中 的 区 域 化 变量 就 是 在 一 维 、 二 维 或 三 维 空间 域 中 展 布 的 随机 函数 。 故 在 对 空间 
和 /或 时 间 上 展 布 的 变量 进行 研究 时 ,有 必要 引进 随机 函数 的 概念 。 


第 二 节 ”随机 过 程 及 其 结构 性 分 析 





一 、 随 机 过 程 


1. 随 机 过 程 的 定义 

在 一 维 时 间 轴 上 展 布 的 随机 函数 称 为 随机 过 程 , 记 为 ZC), t 是 时 间 。 对 某 一 固定 的 时 
A) 4,Z(4) 是 一 个 随机 变量 ,随机 过 程 Z(:) 可 看 作 是 无 穷 多 个 随机 变量 Z(1) 的 集合 ,1 覆盖 
无 限 长 的 时 间 域 (图 5 - 1)。 根 据 随机 过 程 中 时 间 参 量 的 连续 或 离散 性 质 ,可 将 随机 过 程 分 为 
连续 型 随机 过 程 和 离散 型 随机 过 程 。 若 随机 过 程 Z(:) 对 于 任何 的 ET, Z(4) 是 一 个 连续 
型 随机 变量 , 则 称 此 随机 过 程 为 连续 型 随机 过 程 。 若 随机 过 程 Z(1) 对 于 任何 的 n ET, ZC) 
是 一 个 离散 型 随机 变量 , 则 称 此 随机 过 程 为 离散 型 随机 过 程 。 若 随机 过 程 Z(1) 的 时 间 变 化 范 
围 了 是 有 限 或 无 限 区间 , 则 称 Z(4) 是 连续 参数 随机 过 程 。 若 随机 过 程 Z( 4) 的 时 间 是 有 限 个 
或 可 列 个 数 的 集合 , 则 称 Z(:) 是 离散 参数 随机 过 程 或 称 为 随机 变量 序列 。 


an | Z) z) 








图 5-1 随机 过 程 图 示 
图 5 - 1 中 w 和 w, 为 随机 过 程 的 两 个 轨迹 (或 实现 ) ,该 连续 型 随机 过 程 也 可 看 作 是 无 穷 
多 个 实现 的 集合 。 
2. 随 机 过 程 的 数字 特征 
ENZ) < (yt), W Z(4) 称 为 二 阶 随机 过 程 ,此 时 自然 有 E[1Z(1)1] < © 


(Vt)。 
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二 阶 随 机 过 程 的 一 阶 原 点 矩 定义 为 随机 变量 Z(s ) 的 数学 期 望 , 即 
palt) = ELZ) „Et (5 - la) 
注意 ,E[ Z(4)] 是 所 有 样品 函数 在 时 刻 上 的 函数 值 的 平均 ,通常 称 这 种 平均 为 集 平均 ， 
以 区 别 于 时 间 平 均 。jyz (4) 表 示 了 随机 过 程 Z(1) 在 时 刻 1 的 摆动 中 心 。 
二 阶 随 机 过 程 的 二 阶 原 点 矩 定义 为 随机 变量 Z(4) 的 均 方 值 , 即 
Palt) = ELZ(4)] GE (5 - tb) 
二 阶 随机 过 程 的 二 阶 中 心 矩 定义 为 随机 变量 Z(4, ) 的 方差 (1,),o,(4,) 称 为 均 方差 , 且 
有 
(u) = D[Z(14,)] = EUZC) - p,(1)]% „Et (5 - 1c) 
对 于 随机 过 程 在 两 个 不 同时 刻 状态 之 间 的 联系 , 需 在 二 维 概率 密度 的 基础 上 ,定义 新 的 数 
字 特 征 量 。 设 t; 和 4 是 随机 过 程 的 任意 两 个 时 刻 ,Z(# ) 和 Z(5 ) 是 该 两 个 时 刻 的 状态 , 则 二 
阶 随 机 过 程 的 二 阶 原点 混合 矩 定义 为 
SŁZ(4),Z(4,)) = ELZ(4,)Z(4)] (4EnyEtix=j) (5 - 2a) 
类 似 地 ,二 阶 随 机 过 程 的 二 阶 中 心 混合 矩 定义 为 
Cov{ 2(4),2(6)}= C(t,5) = EYCZ(4) - EZ(4)JI ZC4,) - EZ(4)1) 
= ELZ(,)Z(4)]- ELZQ0IE(Z(,)) (WEryEtixj) (5-2b) 
二 阶 中 心 混合 矩 也 称 为 随机 过 程 Z(1) 的 自 协 方差 函数 ,或 两 个 随机 变量 Z(4) 和 ZC) 
之 间 的 协 方差 函数 , 记 为 Cao 
此 处 , 协 方差 函数 的 定义 与 经 典 统计 学 中 协 方差 函数 的 定义 从 形式 上 看 是 完全 相同 的 [ 见 
式 (2- 10)], 但 其 物理 含义 有 所 不 同 ,经 典 统计 学 中 的 协 方差 函数 反映 的 是 两 个 随机 变量 之 间 
的 相关 性 ,而 此 处 的 协 方差 函数 反映 的 是 同一 随机 过 程 在 不 同时 间 点 上 的 两 个 随机 变量 之 间 
的 相关 性 , 它 反 映 随机 过 程 的 自 相关 性 。 


二 、 平 稳 随机 过 程 


平稳 随机 过 程 ,是 统计 特征 不 随时 间 的 平移 而 变化 或 说 不 随时 间 原 点 的 选取 而 变化 的 随 
机 过 程 。 用 严格 的 数学 术语 表达 即 是 :对 时 间 + 的 任意 n 个 数值 6,1,,… ta 和 任意 实数 6, 随 
机 过 程 Z(1) 的 n 维 概率 密度 函数 满足 关系 
fasa2 zai bista bn) = f(z szzi + Eb t+ et +e) (5-3a) 
则 称 随机 过 程 Z(1) 为 平稳 随机 过 程 ,简称 平稳 过 程 。 
利用 上 述 随机 过 程 数字 特征 的 各 个 量 的 定义 ,容易 验证 对 二 阶 平稳 随机 过 程 有 
他 = yt 
Cz(ę,t) = ELZ(,)Z(4)]- p = Cz(r) Tr=t-t 
事实 上 ,对 一 阶 平稳 随机 过 程 的 一 维 概率 密度 函数 ,只 要 令 e = - 1,, 即 有 
fast) = fit +e) = f(2,;0) (5 - 3c) 
这 表明 ,平稳 随机 过 程 的 一 维 概率 密度 不 依赖 于 时 间 , 记 为 f(z,), 于 是 Z(1) 的 均值 为 常 
BAK p, EA 


(5 - 3b) 


ELZQ,)] = f zf(z)dz, = y (5 - 3d) 
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同 理 , 也 可 以 证 明 , 对 二 阶 平稳 随机 过 程 ,其 均 方 值 和 方差 也 为 常数 ,请 读者 自行 验证 。 
对 二 阶 平稳 随机 过 程 的 二 维 概率 密度 函数 ,同样 令 e = — i, 和 r=4 4, 即 有 


fGnzit,t) = f(z5t + ert +e) = f(z,5;0,7) (5 - 4a) 


这 个 关系 式 表明 ,二 阶 平稳 随机 过 程 的 二 维 概率 密度 只 依赖 于 时 间 间 隔 r, 而 与 时 间 的 取 
(Bt „1, JEŻ ICH /(z; ,sir)。 因 此 , 若 设 := t,t t- t WEENIE Z(1) 的 二 阶 混合 矩 可 
表示 为 


Sa = ELZ(1) Z(t + 7)] -f ju zzf(2, air)dzdzl (5 - 4b) 
随机 过 程 Z(1) 的 协 方差 函数 C. (rz) 可 以 表示 为 
Cz(r) = E{[2Z(1) - a][Z(t + r) - pl}= S„(r)- p? (5 - 4c) 


由 以 上 的 分 析 知 道 , 二 阶 平稳 随机 过 程 的 均值 为 常数 ,二 阶 混合 矩 S。 为 单 变量 r 的 函数 ， 
而 且 其 协 方差 函数 具有 以 下 重要 特性 : 
(1) Cz(r) 是 一 个 相对 于 纵 轴 对 称 的 函数 , 即 


Cz(r) = Czz(- r) (5 - 5a) 
(2) 当 r=0 时 , 协 方差 即 为 变量 的 方差 ,变量 的 方差 总 大 于 0, 即 
Cz(0) = o? > 0 (5 - 5b) 
(3) 满 足 Schwartz 不 等 式 , 即 
Czz(r) < Cz(0) (5 - 5c) 


式 (5 - 50) RBA „Hy ŻEP KIE — (BOK PAK, JEWEL LET BÓL (AJ AJ (AJ MA ASK, 
随机 过 程 的 自 相关 性 减弱 。 
若 对 于 给 定 的 随机 过 程 Z(1), 有 E[2Z(4)] = 为 常数 ,而 且 
ELZ*(1)] <+ © ,ELZ(1)Z(t + r)1 = S„(r) (5 - 6) 
则 称 随机 过 程 Z(1) 为 宽 平稳 过 程 或 广义 平稳 过 程 。 


三 ,二 阶 平稳 假设 条 件 下 的 自 相关 函数 及 其 性 质 


同 协 方差 函数 一 样 , 自 相 关 函 数 也 是 表征 随机 过 程 时 间 相 关 结 构 性 的 一 个 重要 函数 ,与 协 
方差 函数 有 如 下 关系 
Cz(r) 





palt) = CEO) 6-7 
(2) poxz(r) 与 r 的 关系 图 称 为 自 相 关 图 (图 5- 2)。 
1 自 相 关 函 数 具 有 以 下 4 个 性 质 : 
o 7 (Dpaz(0)=1 A|pz(z)| <i(r=0); 


K (2)pozz(z) 的 周期 与 随机 过 程 的 周期 相同 ， 
(3) 当 pzz(z) 很 快 趋 近 于 0 时 ,随机 过 程 为 平稳 过 
程 ,反之 , 则 为 非 平 稳 过 程 ; 
(4) 对 于 白 噪 音 ,pz(0) =1,pzz(r) =0(r 关 0), 白 噪音 是 无 时 间 相关 结构 的 一 种 特殊 随机 
过 程 , 是 一 种 纯粹 随机 的 过 程 。 
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图 5-2 一 个 随机 过 程 的 自 相 关 图 








第 三 节 区域 化 变量 及 其 变 差 函数 的 功能 


一 、 区 域 化 变量 的 涵义 


1. 区 域 化 变量 的 定义 

地 质变 量 多 为 在 空间 上 展 布 的 变量 ,地 质变 量具 有 区 域 性 特点 , 即 在 一 定 的 区 域内 展 布 ， 
在 地 质 统计 学 中 ,把 地 质变 量 称 作 区 域 化 变量 ,如 储 集 层 的 孔 、 渗 、 饱 及 盖 层 厚度 等 ,都 是 区 域 
化 变量 。 

区 域 化 变量 是 在 空间 里 的 随机 函数 ,在 空间 上 的 任 一 点 ,都 对 应 有 一 个 随机 变量 ,不 同 空 
间 点 上 的 随机 变量 之 间 具 有 相关 性 。 所 以 ,区 域 化 变量 既 能 反映 空间 变量 的 结构 性 ,又 能 反映 
其 随机 性 ,具有 双重 性 的 功能 ,这 是 地 质 统计 学 与 经 典 统计 学 的 本 质 区 别 所 在 。 

区 域 化 变量 在 观测 前 为 随机 场 ,在 观测 后 为 三 元 实 值 函数 或 空间 点 函数 ,凡是 在 空间 上 展 
布 的 地 质变 量 都 可 称 为 区 域 化 变量 。 

2. 区 域 化 变量 的 物理 学 或 地 质 学 特性 

1) 区 域 化 变量 有 明确 的 物理 含义 

如 孔隙 度 \ 渗 透 率 等 地 质变 量 的 物理 含义 是 明确 的 ,是 随机 函数 在 研究 空间 变量 中 的 具体 
应 用 ,而 随机 函数 本 身 只 具有 纯粹 的 数学 意义 。 

2) 空 间 局 限 性 

区 域 化 变 基 往往 只 存在 于 一 定 的 空间 范围 内 ,如 含油 饱和 度 只 限于 油 藏 范围 内 ,这 一 空间 
称 为 区 域 化 变量 的 几何 域 。 空 间 局 限 性 还 表现 在 ,区 域 化 变量 是 按 几 何 承载 来 确定 的 ,如 孔隙 
度 是 在 一 定 直径 的 岩心 上 确定 的 ,如 果 承 载 变 了 则 会 得 到 一 个 新 的 区 域 化 变量 。 

3) 不 同 程度 的 连续 性 

不 同 的 区 域 化 变量 具有 不 同 程度 的 连续 性 ,也 就 是 说 不 同 的 区 域 化 变量 的 空间 结构 性 或 
相关 性 是 不 同 的 。 

4) 不 同类 型 的 各 向 异性 

区 城 化 变量 在 各 个 方向 上 如 果 性 质 相同 , 则 称 其 为 各 向 同性 的 ,种 则 , 称 其 为 各 向 异性 的 。 
地 质变 量 往往 是 各 向 异性 的 , 且 各 向 异性 的 类 型 也 有 不 同 。 


二 区域 化 变量 的 协 方差 函数 和 变 差 函 数 


在 第 一 节 中 ,通过 随机 过 程 的 概念 ,引入 了 与 时 间 变 量 或 时 间 间 隔 有 关 的 协 方差 函数 ,对 
区 域 化 变量 的 随机 函数 ,只 需 将 上 述 时 间 变 量 替 换 成 空间 位 置 变量 ,那么 上 述 各 个 数字 特征 量 
的 定义 及 性 质 可 以 同样 地 成 立 。 
不 妨 设 Z(x) 和 Z(x + h) HHE h 的 两 个 随机 变量 (x 和 x + h 是 空间 上 相距 为 h 的 两 
点 ), 则 这 两 个 随机 安 量 之 间 的 协 方差 函数 为 
Col Z(x),Z(x + h)] = C(x,x +h) 
= EXZ(x) - ELZ(x)]RHZ(x + h) - ELZ(x + h)]} (5 - 8) 
= ELZ(x)Z(x + h)]- ELZ(x)IELZ(x +h)] yx Yh 
由 此 可 见 , 协 方差 函数 依赖 于 空间 点 x 和 h, 当 h=0 时 有 
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C(x,x) = ELZ(x)1- (E[Z(x)]F = Varl Z(x)] Vx (5-9) 
式 (5-9) 中 Varl Z(z)] 为 > 点 处 随机 变量 Z(z) 的 方差 或 称 验 前 方差。 
Z(z) 和 Z(a +h) 这 两 个 随机 变量 之 间 的 协 相关 系数 为 
ov[ Z(x),Z(x + h)] 
ee cr crn Y YA 
在 地 质 统计 学 中 ,为 考察 区 域 化 变量 的 空间 变化 特征 ,引入 变 差 画 数 的 概念 , 变 差 数 定 
义 为 增 量 方差 之 半 , 辑 


7(2,x + h) = ZVal Z(x) - Z(x + h)] (5 - 11) 


(5 - 10) 


= ZELZ(A) - Z(x + h)? - ZIELZ(2)) - ELZ(z + KOJE Vx.Vh 


三 ,随机 函数 的 平稳 假设 和 本 征 假设 


1. 假 设 的 必要 性 

要 估计 变 差 函数 值 , 就 要 能 估计 数学 期 望 值 E[Z(x) - Z(x+h)]、E[Z(x)] 和 E[Z(x 
+h)][ 见 式 (5 - 11)], 这 就 必须 有 若干 对 Z(x) 和 Z(x+4) 的 值 。 实 际 工作 中 这 一 条 件 是 不 
可 能 满足 的 ,因为 地 质问 题 不 同 于 人 为 的 随机 试验 ,不 可 能 在 一 个 点 上 重复 取样 ,无 法 对 
E[Z(x) - Z(x+h)]\E[Z(x)] 和 ELZ(x+h)] 进 行 估计 ,这 就 在 统计 推断 上 发 生 了 困难 。 
为 了 克服 这 一 困难 ,就 需要 对 Z(x) 做 一 些 假设 。 

2. 平 稳 假 设 

平稳 假设 又 分 为 强 平稳 假设 和 弱 平稳 假设 。 

1) 强 平稳 假设 

假设 区 域 化 变量 Z(x) 的 任意 n 维 分 布 函数 (联合 分 布 ) 均 不 因 空间 点 x 发 生 位 移 h 而 改 
变 , 则 称 区 域 化 变量 为 强 平稳 ,用 公式 表达 为 


F esa, (Z02232) = PIZ(A) < z,Z(m) < 21s ZK) < z.) 
=P{Z(x +h) < 2,2(x2 + h) zy ,Z(x, + h) < z} 
= 有 ar (5 - 12) 
2) 弱 平稳 假设 


强 平稳 假设 只 有 数学 上 的 意义 ,在 实际 应 用 中 ,很 难 找到 满足 强 平稳 假设 的 变量 ,这 就 需 
要 我 们 放宽 假设 条 件 ,以 满足 实际 中 遇 到 的 大 多 数 变量 ,一 般 采用 弱 平稳 假设 , 即 只 假设 2Z(x) 
的 一 阶 矩 和 二 阶 矩 存在 且 平稳 , 称 为 二 阶 平稳 , 即 
E[Z(x)]=n Yx 
Cov[ Z(x),Z(x +h)]=C(h)=ELZ(x)Z(x+h)]-E[Z(x)]E[Z(x+h)) (5-13) 
=E[Z(x)Z(x+h)]j-p Vx,Vh 
在 二 阶 平稳 假设 的 条 件 下 , 变 差 函数 式 (5 - 11) 可 写 为 


7(2,h) = Vh) = ZE[Z(A) - Z(+ h)? Vx.Vh (5 - 14) 


有 了 二 阶 平稳 假设 ,我 们 把 空间 上 相距 为 h 的 所 有 数据 点 找 出 来 构成 数据 点 对 ,利用 这 
些 数据 点 对 即 可 对 E[ Z(x) - Z(x+ hh) 了、E[Z(x)] 和 EL[Z(x+h)] 进 行 估计 ,这 就 解决 了 上 
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述 统计 推断 的 困难 。 
在 平稳 假设 条 件 下 , 变 差 函数 和 协 方差 函数 之 间 存 在 如 下 关系 
7(h) = C(0) - C(h) (5 - 15) 


图 5-3 展 示 了 7Y(h) 和 C(h) 之 间 的 对 应 关系 。 


C(0) 








图 5-3 Y(h) 与 C(h) 之 间 的 关系 示意 图 


注 : 式 (5 - 15) 的 推导 过 程 如 下 : 
706) = FELZ) - ZC + WI = TELLZ(2) - u) - UZC + h) -py 
去 ELZ(z) - uP - EUZC) - pJLZ(» + h) - u] + ZELZ(2+h)- p]? 
= 400) - ELZ(») - pILZ(x + h) - a] + CO 
= C(0) - E[Z(x) - n][Z(x + h) - p] = C(0) - C(h) 
式 (5- 15) 推 导 完毕 。 
3. 本 征 假设 
为 了 更 加 弱化 假设 条 件 以 便 适 应 更 多 的 地 质变 量 , 引 入 本 征 假设 ,该 假设 要 求 增 量 方差 存 
在 且 平 稳 , 即 要 求 Z(x) 满 足以 下 条 件 : 
E[Z(x)-Z(x+h)]=0 Vx,Vh 
Var[ Z(x) - Z(x +h)]=E[Z(x)- Z(x+h)) -tE[Z(x)- Z(x+h)]) (5:46) 
= E[Z(x) - Z(x+h)] 
=2y(h) Vx,Vvh 
4. 本 征 假设 与 二 阶 平稳 假设 的 比较 
本 征 假设 与 二 阶 平稳 假设 相 比 ,其 条 件 更 弱 ,适用 的 变量 更 多 ,满足 二 阶 平稳 假设 的 变量 
一 定 满足 本 征 假 设 , 而 满足 本 征 假设 的 变量 不 一 定 满足 二 阶 平稳 假设 ,下 面 给 出 的 例子 就 是 一 
个 满足 本 征 假设 而 不 满足 二 阶 平稳 假设 的 情况 。 
【 例 5-1】 变量 Z, 由 以 下 方式 构成 
-[ 1 PEU (x 相互 独立 ,i=1,2,…,n) 
-1 P=1/2 
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问 Z 是 否 满 足 平稳 假设 ? 是 否 满足 本 征 假设 ? 

R: Z, IEN ELZ,] = S ELX) =0 

Z, 的 方差 为 (è 

Var(Z,) = Var( x) = X varta) = Z te - LEX)F) = Be )=n 


4 noh}, Z, 的 方差 也 趋 近 于 无 穷 大 ， rz 的 方差 和 协 方差 不 存在 ， 所 以 Z, 不 满足 平 
稳 假 设 , 然 而 Z, 的 变 差 函数 


Yh) = Y(m- n) = ZELZ(M) -ZT = EDX- DX +" 


是 存在 且 于 稳 的。 
因此 , Z, 满足 本 征 假 设 ,但 不 满足 二 阶 平稳 假设 。 


四 、 在 二 阶 平稳 假设 条 件 下 变 差 函 数 的 性 质 和 功能 


在 二 阶 平稳 假设 条 件 下 , 区域 化 变量 的 协 方差 函数 C Ch ) 与 随机 过 程 的 协 方差 函数 
Cz(r) 具 有 相似 的 性 质 ,在 此 不 再 袭 述 。 惟 一 不 同 的 是 C(h) 必 须 是 非 负 定 的 函数 , 即 要 求 由 
C(x, ,xi) 构 成 的 协 方差 函数 矩阵 必须 是 非 负 定 矩 阵 ,这 一 要 求 是 为 了 保证 后 面 的 克 立 金 方程 
组 ( 见 第 六 章 ) 有 且 只 有 一 组 解 ,下 面 仅 就 变 差 函 数 的 性 质 和 功能 进行 讨论 。 

1. 变 差 函 数 的 性 质 

(1) 协 方差 函数 反映 变量 的 相关 性 ,而 变 差 函数 反映 变量 的 变化 性 ,二 者 皆 为 区 域 化 变量 
结构 性 表征 的 统计 工具 ,二 者 呈 互 为 消长 的 关系 ,Y(h) 与 C(h) 之 间 存 在 式 (5 - 15) 所 示 的 关 
AH 5-3); 

(2) 当 为 0 时 , 即 变 基 与 其 本 身 相 比 没有 发 生变 化 , 故 有 700) = 0: 

(3) 根 据 变 差 函数 的 定义 [ 式 (5 - 11) 或 (5 - 14)], 变 差 函 数 是 非 负 函数 , 即 7(h) >0; 

(4) 变 差 函 数 是 一 个 相对 于 纵 轴 对 称 的 函数 , 即 7(h) = 7Y( 一 hh); 


(5) - 7(4) 必 须 是 条 件 非 负 定 函数 , 即 要 求 由 -7( x ,zx ) 构 成 的 矩阵 当 ŻA, = 0 时 为 非 


负 定 矩阵 ,这 一 要 求 是 为 了 保证 后 面 的 克 立 金 方 程 组 ( 见 第 六 章 ) 有 且 只 有 一 -组 解 ; 

(6) 当 h 趋 近 于 无 穷 大 时 , 变 差 函 数 达 到 最 大 值 ,该 最 大 值 为 变量 的 方差 , 即 y(%) = C(0)。 

2. 变 差 函数 的 功能 

一 个 典型 的 变 差 函 数 具有 如 图 5 - 4 所 示 的 形态 ,图 中 , C(0) 为 变量 的 验 前 方差 ,在 地 质 
m 统计 学 中 称 为 基 台 值 , C, 为 块 金 值 , C 为 拱 高 ,a 为 变 程 , 变 

| 差 函 数 有 以 下 几 个 功能 : 

(1) 通 过 变 程 反映 变量 的 影响 范围 (如 储 集体 的 分 布 范 
H); 

(2) 变 差 函数 在 原点 处 的 性 状 可 以 反映 变量 的 空间 连续 
i 性 ,图 5-5 中 ,从 抛物 线 型 到 直线 型 到 间断 型 再 到 随机 型 ， 
o a w” 变量 的 连续 性 逐渐 变 差 ; 
图 5- 4 一 个 典型 的 变 差 函 数 图 (3) 不 同方 向 上 的 变 差 函数 图 可 反映 区 域 化 变量 的 各 向 
+ 104 - 


Co 








KC) ia | | 
L 
0 i 0 LENO Fo oo i 


(a) 抛物 线 型 (b ) 直 线 型 《c) 间 断 型 (d) 随机 型 





图 5-5 变 差 函数 在 原点 处 的 性 状 反 映 变量 的 空间 连续 性 

异性 ; 

(4) 变 差 函 数 如 果 是 跃迁 型 的 ,其 基 台 值 的 大 小 可 反映 变量 变化 幅度 的 大 小 ; 

(5) 块 金 常 数 Co 的 大 小 可 反映 区 域 化 变量 随机 性 的 大 小 ,反映 区 域 化 变量 的 微观 变化 和 
测量 误差 ; 

(6) 进 行 变量 的 结构 性 分 析 , 研 究 变 差 函数 ,是 进行 克 立 金 估 计 和 随机 模拟 的 基础 , 变 差 函 
数 给 出 了 变量 的 结构 性 信息 ,是 克 立 金 估计 和 随机 模拟 所 需要 的 , 正 是 利用 了 变量 的 结构 性 信 
息 , 克 立 金 估 计 方 法 与 传统 的 估计 方法 相 比 , 才 具 有 了 其 优越 性 。 


第 四 节 ”实验 变 差 函数 的 计算 和 拟 合 


一 、 实 验 变 差 函数 的 计算 
根据 变 差 数 的 定义 y(h) =L ELZ) - Zla + h) P 可 知 ,实验 变 差 函数 的 计算 公式 为 
Yh) -WD ÈI) - Zn + DP (5 - 17) 


其 中 ,N(h) 为 相距 为 h 的 数据 点 对 数目 。 

1 .规则 和 基本 规则 取样 条 件 下 实验 变 差 函数 的 计算 

在 规则 或 基本 规则 取样 条 件 下 ,计算 变 差 函数 比较 简单 ,在 如 图 5 - 6 所 示 的 正方 形 取样 
网 格 中 , 设 正方 形 的 边 长 为 4, 各 节点 上 的 数据 代表 变量 在 节点 处 的 取 值 。 


5 





2 ws 


Wh | 




















2 一 m Ż 





图 5-6 规则 取样 图 示 ( 节 点 上 的 数值 代表 变量 值 ) 
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在 规则 网 格 情况 下 ,基本 步 长 一 般 取 网 格 的 长 度 (或 宽度 ) , 步 长 取 基本 步 长 的 倍数 ,如 在 
a 方向 上 ,h =32 时 的 实验 变 差 函 数值 为 


1180) = ZxĄ(8+7+P+7)=Txqx18 = 


alo 


= 2.25 


同 理 可 求 函数 7: (6) 7: (24) 27; GOM 7; (V24) 等 。 
2. 不 规则 取样 条 件 下 实验 变 差 函 数 的 计算 
数据 点 不 规则 分 布 是 最 常见 的 现象 ,在 计算 变 差 函数 时 , 按 规 则 网 格 情况 下 的 计算 方法 就 
„asd 会 行 不 通 ,这 时 ,要 给 出 角度 容 差 d 和 距离 容 差 6, 落 
4 在 图 5-7 所 示 扇 形 区 域 中 的 点 就 认为 是 在 a 方向 上 
a 与 “点 相距 为 h 的 点 , 据 此 ,确定 了 在 a 方向 上 与 xo 
点 相距 为 h 的 数据 点 对 后 ,就 可 根据 式 (5 - 17) 计 算 
实验 变 差 函 数 。 
3. 变 差 函 数 计算 的 一 般 步 又 
由 于 区 域 化 变量 常常 存在 各 向 异性 , 即 不 同方 向 
图 5-7 不 规则 网 格 条 件 下 实验 变 差 画 ”上 的 变 差 函数 不 同 , 变 差 函 数 的 一 个 重要 功能 就 是 要 
数 计算 时 数据 点 对 的 确定 方法 反映 区 域 化 变量 的 各 向 异性 特征 ,实验 变 差 函数 一 般 
d WINNE e 为 距离 容 差 按 以 下 步骤 计算 : 

(1) 从 单 向 性 变 差 函数 的 计算 开始 ,注意 这 样 做 并 不 意味 着 假设 变量 是 各 向 同性 的 。 这 样 
做 的 目的 ,一 是 作为 计算 变 差 函数 的 开端 ,对 确定 变 差 函 数 计算 中 的 某 些 参 数 有 用 ,二 是 为 了 
避免 在 计算 方向 性 变 差 函数 时 的 某 些 偏差 。 

(2) 在 单 向 性 变 差 函数 计算 的 基础 上 ,计算 方向 性 变 差 函数 。 在 许多 实际 问题 中 ,常常 有 
些 已 知 的 信息 (如 河道 砂 体 展 布 方 向 等 信息 ) 表 明 各 向 异性 的 方向 ,这 些 信息 有 助 于 方向 性 变 
差 函 数 计算 时 方向 的 选择 。 若 事先 不 知道 各 向 异性 的 方向 ,这 时 ,在 计算 方向 性 变 差 函数 时 ， 
就 要 通过 不 同方 向 上 的 变 差 函 数 的 玫瑰 花 图 确定 各 向 异性 的 方向 。 

(3) 若 通过 分 析 证 明 变 量 是 各 向 同性 的 , 则 此 时 可 求 出 平均 变 差 函 数 

Y My! (h) 
Y' (h) = —— (5 - 18) 





4 hie h he 





式 中 ,Y?(h) 为 i 方向 上 的 变 差 函数 ;N, 为 i 方向 上 变 差 丽 数 计算 时 相距 的 数据 点 对 的 个 
数 。 


二 、 实 验 变 差 函数 的 拟 合 


1 . 拟 合 的 必要 性 
1) 消 除 实验 变 差 函数 中 的 不 稳定 因素 
在 实验 变 差 函数 的 计算 中 ,由 于 数据 中 存在 的 随机 性 、 波 动 性 和 数据 数量 的 限制 (实际 应 
用 中 ,常常 出 现 数据 稀少 的 情况 ), 导 致 实验 变 差 值 计 算 中 存在 不 确定 性 和 波动 性 ,需要 通过 拟 
合 来 消除 这 种 不 确定 性 和 波动 性 。 
2) 满 足 克 立 金 方程 组 求解 的 要 求 
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在 后 面 的 克 立 金 方法 中 ,建立 和 求解 克 立 金 方程 组 ,需要 知道 任 一 方向 、 任 一 步 长 h 所 对 
应 的 变 差 函 数值 ,通过 实验 变 差 函 数 的 拟 合 ,得 到 一 个 随 h 变化 的 连续 函数 ,以 满足 克 立 金 方 
程 组 求解 的 要 求 。 

3) 保 证 克 立 金 方程 组 有 且 只 有 一 组 解 

为 了 使 克 立 金 方程 组 有 而 且 只 有 惟一 的 解 ,不 是 任何 函数 都 可 作为 变 差 函数 来 使 用 的 ,地 
质 统计 学 家 经 过 研究 和 数学 论证 ,已 提出 了 若干 函数 形式 ( 见 后 面 的 基本 模型 ), 这 些 函 数 形 式 
是 可 以 作为 变 差 函数 来 使 用 的 ,利用 这 些 函 数 形式 ,来 拟 合 实验 变 差 函 数 , 就 能 够 保证 克 立 金 
方程 组 有 目 只 有 一 组 解 (已 经 过 理论 统计 学 家 们 的 证 明 )。 在 具体 应 用 时 ,采用 这 些 函 数 形 式 
就 足够 了 ,没有 必要 再 去 “创造 "其 它 函数 形式 。 

2. 拟 合 的 3 个 条 件 

1) 稳 健 估 计 

首先 ,实验 变 差 函 数 的 估计 应 该 是 稳健 的 ,如 遇 数 据 中 存在 特异 值 的 情况 ,在 进行 实验 变 
差 函 数 计算 时 ,要 剔除 这 些 特异 值 ,以 保证 实验 变 差 函 数 估计 的 稳健 性 。 

2) 正 确 的 模型 

针对 不 同 的 变量 及 其 实验 变 差 函数 的 形态 特点 ,选取 合适 的 模型 进行 拟 合 ,才能 得 到 反映 
变量 结构 性 特点 的 正确 模型 。 

3) 好 的 拟 合 方法 

可 调整 模型 参数 的 计算 程序 ,以 便于 找到 最 好 的 拟 合 。 

3. 基 本 模型 

变 差 函 数 有 多 种 模型 ,包括 有 基 台 值 的 模型 .无 基 台 值 的 模型 . 纯 块 金 效 应 模型 和 空 穴 效 
应 模型 等 。 无 基 台 值 的 模型 包括 短 函 数 模型 和 对 数 函 数 模型 , 纯 块 金 效应 模型 反映 变量 是 纯 
随机 的 , 空 穴 效应 模型 往往 是 以 某 种 套 合 的 方式 伴随 着 其 它 有 基 台 值 或 无 基 台 值 模型 而 出 
现 。 

最 常用 的 模型 是 有 基 台 值 模型 ,有 基 台 值 模型 又 包括 球状 模型 .指数 模型 和 高 斯 模型 (图 
5- 8) ,下 面 是 3 种 常用 的 有 基 台 值 模型 的 表达 式 。 


rh) $ 


1 
0.95 





| 
| 








图 5-8 三 种 有 基 台 值 模型 的 形态 曲线 
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1) 球 状 模型 


0 (h = 0) 
Yh) = Gret- TA) (0< ha) (5 - 19) 
C + C (h > a) 
2) 指 数 模型 
h) p AER (5 - 20) 
TH = laca- e)  (h>0) T 
3) 高 斯 模型 
©) Y (h = 0) ( ) 
h) = 2,2 5-21 
ź Co+C(l-e**) (>0) 


对 球状 模型 , 变 差 函 数 达 到 基 台 值 时 对 应 的 h 值 a 即 为 变量 的 变 程 ,对 指数 模型 和 高 斯 


模型 , 变 差 函 数值 达到 基 台 值 的 95% 时 对 应 的 h 值 分 别 为 3a 和 V3a,3a 和 V3a 分 别 可 近似 地 
看 作 指 数 模型 和 高 斯 模型 的 变 程 。 


三 、 变 差 函 数 实例 分 析 


用 变 差 函数 对 塔里木 盆地 轮 南 凸 起 的 实测 地 层 压 力 这 一 区 域 化 变 基 进行 了 分 析 , 在 进行 
结构 分 析 之 前 ,我 们 首先 在 纵向 上 进行 了 压力 系统 的 划分 ,分 为 上 部 常 压 系 统 、 中 部 超 压 系统 
和 深部 常 压 系 统 。 

根据 尝试 对 比 ,我 们 选择 球状 模型 作为 研究 区 地 层 压 力 的 变 差 函 数 模型 , 表 5 - 1 列 出 了 
塔 北 隆起 3 个 压力 系统 地 层 压力 在 不 同方 向 上 的 变 差 函 数 模型 的 参数 。 

由 表 5- 1 可 以 看 出 在 不 同方 向 上 , 变 程 . 基 台 值 块 金 值 差别 比较 大 ,特别 在 中 部 的 超 压 
压力 系统 内 ,在 东西 方向 和 南北 方向 上 , 变 程 和 块 金 值 的 差别 更 为 明显 (图 5 - 9) ,反映 出 地 层 
压力 具有 明显 的 各 向 异性 。 


RS-1 塔里木 盆地 轮 南 凸 起 不 同 压 力 系统 的 变 差 函数 拟 合 参数 
a 
































参数 变 程 (a),m 基 台 值 (C+ Co) 块 金 值 ( Co) 
压力 系统 东西 方向 | 南北 方向 | 东西 方向 | 南北 方向 | 东西 方向 | 南北 方向 
上 部 静水 压力 系统 24300 | 30000 0.0071 oon | 0.0015 0.0004 nm 
中 部 超 压 压 力 系 统 14800 | 29635 0.0183 0. 0139. 0.0006 j 0.0081 o 
FABRYK HEJ RE mo | 30100 | 0.0091 | 0.0013 0.0002 0.0000 











通过 表 5 - 1 的 参数 ,可 以 描述 塔 北 隆起 不 同 压力 系统 内 地 层 的 结构 特征 : 

(1) 上 部 和 下 部 静水 压力 系统 内 压力 系数 的 块 金 值 都 比较 小 ,反映 了 地 层 压 力 在 这 两 个 压 
力 系统 内 的 连续 性 较 好 ;在 超 压 压 力 系统 内 , 块 金 值 比较 大 ,反映 了 赵 讨 庄 力 系统 内 地 层 压力 
的 随机 性 比较 明显 。 

(2)3 个 压力 系统 内 的 变 差 函 数 都 不 尽 相同 ,不 同方 向 上 变 差 函数 的 差异 也 比较 明显 , 表 
明 塔 北 隆起 内 的 地 层 压 力 呈 现 较 强 的 各 向 异性 。 

(3) 上 部 和 下 部 静水 压力 系统 内 压力 系数 在 不 同方 向 上 的 变 程 一 般 在 24 ~ 30km 内 ,相差 
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n 
0.04 ] 0.0132 | EW 
AR a: Ss 
| i | 
o 0 
14800 h 29635 h 
(a) 东西 方向 的 变 差 函数 (b) 南北 方向 的 变 差 函 数 。 


图 5- 9 中 部 超 压 压 力 系 统 地 层 不力 在 东西 和 南北 两 个 方向 上 变 差 函 数 的 拟 合 图 
不 大 ,表明 这 两 个 压力 系统 的 地 质 体 结构 呈现 圆 ~ 近 圆 状 ;而 中 部 的 超 压 压力 系统 在 南北 方向 
与 东西 方向 上 的 各 向 异性 比 达到 2.002, 呈 现 带 状 各 向 异性 。 
(4) 在 上 述 3 个 压力 系统 内 ,从 总 体 上 看 来 ,东西 方向 的 基 台 值 比 南北 方向 上 的 要 大 ,反映 
了 地 层 压 力 在 东西 方向 上 的 变化 幅度 更 大 。 


第 五 节 ”实验 变 差 函数 的 结构 套 合 


实际 区 域 化 变量 的 变化 性 是 很 复杂 的 ,往往 包含 有 各 种 尺度 上 的 多 层次 的 变化 性 ,反映 在 
变 差 函数 上 ,就 是 其 结构 性 往往 不 是 单一 结构 ,而 是 多 层次 结构 养 加 在 一 起 一 一 套 合 结构 。 大 
尺度 的 变化 总 是 包含 着 小 尺度 的 变化 在 内 的 ,但 是 ,在 只 有 大 尺度 观测 数据 的 条 件 下 ,不 能 从 
大 尺度 的 变化 性 中 区 别 小 尺度 的 变化 性 ,观测 得 细 ,结论 也 细 ,观测 得 粗 ,结论 也 就 粗 。 

套 合 的 目的 是 获得 一 个 反映 随 着 距离 和 方向 变化 的 变 差 函 数 。 


一 、 各 向 同性 条 件 下 的 结构 套 合 
各 向 同性 是 指 区 域 化 变量 在 不 同方 向 上 的 变化 性 完全 相同 。 在 此 情况 下 ,可 直接 进行 变 
ŻERKÓW A EM), BI 7(h) = Yoh) +7 Ch) + Yi(h)+…。 不 同 尺度 上 的 结构 可 以 


是 相同 的 模型 ,也 可 以 是 不 同 的 模型 。 如 某 各 向 同性 区 域 化 变量 的 变 差 函数 由 yo(h)、y,(h) 
和 7y,(h)3 个 不 同 尺度 上 的 结构 组 成 ,Yo(h)、Y,(h) 和 7,(h) 分 别 为 


0 (4=0) 
rh) | (5 - 22) 
Co (h > 0) 
3h ih 
GEALE (Ozksa) 
„a -| "2a ża ' 6-23) 
C, (h > a,(a, < a,)) 
3h ih 
(EE a 
„a -| 0 Żyda ? (5 - 24) 
OA (h > a) 


MA RAEE AEE RRO 3 个 变 差 函数 Yo(h)、Y,(h) 和 7Y,(h) 之 和 , 即 
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0 (h = 0) 


30, Cr, ,Gp 
Co + 2a * a)! - zł + (0<h<a,) 
Yh) = ; (5 - 25) 
6 +0 + GG -7 gą) (a, < h < a) 
C + C, +C (h > a) 


各 向 同性 条 件 下 变 差 函数 的 套 合 过 程 如 图 5 - 10 所 示 。 


rh) 








图 5- 10 HEPER PETF AE R O E A BOR AAA 


二 、 区 域 化 变量 各 向 异性 条 件 下 的 结构 套 合 

各 向 异性 指 在 不 同方 向 上 ,变量 的 变化 性 不 同 ,各 向 异性 又 分 为 几何 各 向 异性 、 带 状 各 向 
异性 和 混合 各 向 异性 :在 不 同方 向 上 基 台 值 相同 但 变 程 不 同 , 称 为 几何 各 向 异性 , 见 图 5 - 11 
(a) ;在 不 同方 向 上 基 台 值 不 同 但 变 程 相同 , 称 为 带 状 各 向 异性 , 见 图 5 - 11(b); 在 不 同方 向 
上 , 基 台 值 和 变 程 都 不 同 , 称 为 混合 各 向 异性 , 见 图 5 - 11(e) ,混合 各 向 异性 是 最 常见 的 
情况 。 


rih) xa 
| 


0 a a h o a= h 0 a, a h 
GJLAABRTE b 带 状 各 向 异性 《c) 混合 各 向 异性 








图 5- 11 不 同类 型 各 向 异性 示意 图 
1. 几 何 各 向 异性 情况 下 的 结构 套 合 
当 区 域 化 变量 为 几何 各 向 异性 时 ,要 先 对 同一 尺度 上 的 各 向 异性 结构 进行 各 向 同性 化 处 
理 ,然后 再 把 同性 化 后 的 不 同 尺度 上 的 结构 合 加 而 实现 套 合 。 
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DEŽA A RELER 
假设 式 (5 - 26) 和 (5 - 27) 分 别 为 某 区 域 化 变量 在 x 方向 和 y 方向 上 的 变 差 函 数 


0 (h, = 0) 
ra0-idzk-rk]  0<kh<a) (5 - 26) 

c (h, > a,) 

0 (h, = 0) 
rkzidżż-15] Och <) (5 - 27) 

c j (h, > a,) 


这 两 个 变 差 函数 的 基 台 值 皆 为 C(0) ,但 在 两 个 方向 上 的 变 程 不 同 , 分 别 为 a, 和 a,, 属 儿 
何 各 向 异性 。 

通过 式 (5 - 28) 的 坐标 变换 后 ( 见 图 5 - 12), 得 到 一 个 各 向 同性 化 的 变 差 函 数 [ 式 
(5-29)]。 











图 5- 12 几何 各 向 异性 各 向 同性 化 的 坐标 变换 示意 图 


u 
s| 
= 
r 
AIF 
T 
L 


(5 - 28) 


si 


+14." 





0 (h = 0) 


70%) = 4cl3a- 4a] (0<h<1) (5 - 29) 
c (h > 1) 
注意 (h A y( 方 ) 的 函数 类 型 必须 相同 ,才能 进行 式 (5 - 28) 的 坐标 变换 。 
2) 不 同 尺度 上 结构 的 套 合 


在 对 同一 尺度 上 的 几何 各 向 异性 进行 各 向 同性 化 后 ,对 不 同 尺 度 上 的 结构 可 进行 释 加 套 
合 ,如 式 (5 - 30) 即 为 式 (5 - 31) 和 (5 -32) 两 个 各 向 同性 化 之 后 的 变 差 函 数 的 着 加 。 
Y(h) = yi(h) + Va(h,) (5 - 30) 


na = n| (Ee) E7) (5-31) 
lh) = zl èy (£7) 6-32) 


2. 带 状 各 向 异性 情况 下 的 结构 套 合 
带 状 各 向 异性 的 变 差 函数 可 以 看 作 一 种 不 同方 向 结构 的 套 合 结构 ,在 这 种 套 合 结构 中 ,可 
直接 把 各 部 分 相 加 , 即 





Y) = Dh) (5 - 33) 


3. 混 合 各 向 异性 情况 下 的 套 合 结构 

在 混合 各 向 异性 中 ,每 一 个 组 成 结构 可 以 具有 各 自 不 同 的 异 向 性 但 都 可 以 通过 适当 的 线 
性 变换 化 为 各 向 同性 后 属 加 ,其 中 ,有 的 y,(h) 可 以 是 几何 异 向 性 的 ,对 每 个 组 成 结构 分 别 进 
行 一 种 适当 的 坐标 线性 变换 ,把 它们 转化 为 各 向 同性 结构 ,最 后 ,再 把 这 些 各 向 同性 结构 套 合 
( 司 加 ) 起 来 ,构成 一 个 统一 的 变 差 函 数 模型 。 如 对 图 5 - 13 所 示 的 情况 (a,、a, 和 代表 水 平方 
向 上 区 域 化 变量 的 变 程 ,a, 代表 垂直 方向 上 区 域 化 变量 的 变 程 ), 可 以 把 水 平方 向 各 向 同性 化 
后 ,再 加 上 垂直 方向 的 结构 。 


ko 








图 5- 13 混合 各 向 异性 变 差 函数 示意 图 
水 平方 向 各 向 同性 化 后 的 结构 为 


a o r a 





lh) = a(S +(2)) (5 - 34) 


nalh) = nl) (5 - 35) 


ij 





医 直 方向 结构 为 


套 合 后 的 结构 为 
Y(h) = Y(h,) + Tal ha) (5 - 36) 


令 思 考 和 练习 题 令 


1. 如 何 理解 随机 函数 这 一 概念 ? 

2. 什 么 是 区 域 化 变量 ? 它 的 两 重 性 是 什么 ? 

3. 何 谓 平稳 假设 和 本 征 假设 ?二 者 有 何 区 别 ? 为 什么 要 做 假设 ? 
3. 二 阶 平稳 假设 条 件 下 自 相关 上 蚂 数 有 哪些 性 质 ? 

4. 二 阶 平稳 假设 条 件 下 变 差 函数 有 哪些 性 质 和 功能 ? 

5. 区 域 化 变量 有 何 地 质 特性 ? 

6. 尝 试 推导 关系 式 7 (h) = C(0) - C(h)。 

7. 如 何 理解 几何 各 向 异性 和 带 状 各 向 异性 ? 

8. 变 差 函 数 有 哪些 基本 模型 ? 在 各 向 异性 条 件 下 如 何 进行 套 合 ? 


a 





第 六 章 ” 克 立 金 分 析 方 法 


本 章 学 习 目 的 和 要 求 :了 解 线性 估计 的 基本 概念 ,理解 普通 克 立 金 方法 的 基本 原 
理 和 克 立 金 方程 的 建立 过 程 ,掌握 指示 克 立 金 方 法 的 原理 ,为 随机 模拟 英 定 基础 。 本 
章 学 习 需 以 第 五 章 的 内 容 为 基础 ,同时 ,第 一 章 至 第 三 章 的 基础 知识 也 需要 具备 ,万 
其 是 第 三 章 中 的 最 小 二 乘 原理 必须 掌握 。 


第 一 节 ”估计 间 题 和 线性 估计 方差 


一 ,估计 问题 和 估计 的 一 般 形式 


1. 估 计 间 题 

在 地 质变 量 的 定量 化 研究 中 ,我 们 常常 碰 到 的 问题 是 根据 实测 样品 值 对 未 取样 点 或 未 取 
样 域 的 变量 值 进行 估计 。 例 如 ,在 油气 勘探 中 ,应 用 井中 数据 和 其 它 信息 ,预测 未 钻井 处 地 层 
的 各 种 性 质 , 进 而 对 油 藏 或 储 层 的 各 种 参数 进行 预测 。 

图 6- 1 中 的 样品 值 zz。 ，…,z. 是 在 承载 ,v,，…,v,。 上 测 得 的 ,v, ,vy,,…,v, 称 为 信息 
域 , 记 为 v。 根 据 这 些 样品 值 对 Y 内 的 变量 值 进行 估计 (Y 称 为 待 估 域 ) ,就 是 我 们 要 讨论 的 估 
计 问题 (图 6- 1) ,这 一 问题 的 实质 是 估计 出 变量 在 待 估 域 Y 内 的 平均 值 ,当然 , 待 估 域 了 也 可 
以 是 无 限 小 的 一 个 域 ,此 时 , 待 估 域 就 变 成 了 待 估 点 。 





oO" 














图 6-1 变量 估计 (内 插 ) 的 图 示 
估计 方法 有 很 多 ,如 线性 内 插 、 滑 动 平均 、 三 角形 加 权 、 多 边 形 加 权 和 简单 克 立 金 及 普通 克 
立 金 等 方法 ,其 中 ,简单 克 立 金 方法 和 普通 克 立 金 是 一 种 线性 的 .无 偏 的 和 最 优 的 估计 。 


在 图 6- 1 中 ,车 待 佑 域 V 非 无 限 小 , 则 用 于 估 值 的 克 立 金 方法 称 为 块 克 立 金 , 车 待 估 域 
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无 限 小 , 则 用 于 估 值 的 克 立 金 方 法 称 为 点 克 立 金 , 点 克 立 金 是 块 克 立 金 的 特例 ,在 本 章 克 立 金 
方法 的 讨论 中 ,我 们 以 块 克 立 金 方程 组 的 推导 展开 。 

另外 ,我 们 在 实际 工作 中 也 可 能 会 遇 到 这 样 一 类 问题 :在 已 知 信息 域 " 的 条 件 下 , 问 待 估 
域 Y 中 变量 值 大 于 某 个 给 定 值 (或 称 阔 值 ) 的 概率 是 多 大 ? 这 类 问题 实质 上 是 估计 随机 变量 
Z(Y) 的 概率 分 布 。 这 类 问题 的 解决 ,有 广泛 的 实际 应 用 ,如 采矿 工程 中 可 采 储 量 的 估算 、 环 境 
工程 中 污染 物 浓度 分 布 的 估计 和 油气 藏 工程 中 高 孔 渗 带 的 分 布 等 。 解 决 概率 分 布 估计 问题 常 
用 的 方法 是 指示 克 立 金 方法 ,指示 克 立 金 方 法 是 一 种 非 线性 的 、 无 偏 的 和 最 优 的 估计 ,在 本 章 
介绍 了 简单 克 立 金 方 法 和 普通 克 立 金 方法 之 后 ,我 们 接着 就 介绍 指示 克 立 金 方法 。 

2. 估 计 的 一 般 形式 

由 数理 统计 我 们 知道 ,任何 估计 都 会 有 误差 ,真实 值 与 估计 值 之 差 就 是 估计 误差 ,在 地 质 
统计 学 中 也 不 例外 。 

设 Z(x) 为 一 个 二 阶 平稳 区 域 化 变量 , 即 Z(x) 满 足 式 (5 - 13) 所 要 求 的 条 件 ,其 协 方差 函 
数 C(h) 和 变 差 函数 yY(h) 存 在 且 平 稳 。 

区 域 化 变量 Z(x) 在 v, 和 VV 上 的 值 实际 上 是 Z(x) 在 v; 和 V 上 的 平均 值 , 即 





ZG) = | Zd 6-1) 
Z(W) = [20y 6-2) 

FH Z"(V) 代 表 用 信息 域 数据 对 待 估 域 的 估 值 , 则 估计 误差 为 
RO) = Z(V) - Z* (V) (6 - 3) 

可 以 证 明 , 若 Z(x) 是 二 阶 平稳 的 , 则 R(Y) 也 是 二 阶 平稳 的 , 即 
E[R(W)] = pm CY x „pie 一 般 为 0) (6 - 4) 
Var[ R(V)] = oz (Y=) 6-5) 


这 表明 , 当 Z(x) 为 二 阶 平稳 且 RV) = Z(V) - Z* (VA, RC WAYŻKAW OAI o 
= E[Z(W)- Z (7 总 是 存在 且 平 稳 。 

估计 方差 是 衡量 一 个 估计 好 坏 的 重要 尺度 。 但 在 寻求 一 个 好 的 估计 量 之 前 还 必须 考虑 估 
计量 的 函数 形式 。 

估计 Z(V) 的 问题 ,最 一 般 的 形式 是 求 函 数 S, tE Z” (W) =ftz(v,) alv), zC) Mk 
足以 下 两 个 条 件 ; 

(1) 无 偏 性 一 5[LZ (V)]=ELZ(V)]: 

(2) 最 优 性 一 估计 方差 o = ELZ(V) - Z” (WYJ 最 小 。 

为 此 ,首先 要 计算 出 E[Z(V) - Z (Vy)] 和 ELZ(V)- Z*(V)T 来 ,以 便 再 从 /要 满足 的 
两 个 条 件 求 得 一 个 方程 组 ,从 而 解 出 了 来 。 而 要 计算 这 两 个 数学 期 望 ,就 要 知道 (n + 1) 维 随 
机 变量 的 联合 分 布 , 即 采用 “条 件数 学 期 望 ” 


Z* (V) = E{Z(V)Iz(v,),z(v), s z(v,)} (6 - 6) 
实际 上 ,我 们 只 能 得 到 n 维 随机 变量 的 一 个 实现 , 故 无 法 知道 上 述 的 联合 分 布 ,采用 最 一 般 的 
函数 形式 了 进行 估计 遇 到 困难 ,下 面 ,我 们 探讨 用 线性 估计 形式 来 解决 估计 问题 的 可 能 性 。 
3. 线 性 估计 形式 
如 果 我 们 限制 函数 刻 只 取 线性 函数 形式 的 话 ,就 可 以 根据 Z(x) 的 协 方 差 函 数 (或 变 差 函 
人 





数 ) 来 计算 出 ELZ(V) - Z*(V)] 和 ELZ(V) - Z” (Y) 了 ,因此 ,我 们 将 采取 线性 估计 形式 
20 = Da0) = HZ] zoa (6-7) 


在 平稳 假设 条 件 下 采用 线性 估计 形式 ,就 可 算出 E[Z(V) - 2" (WIRIELZ(V) - 
Z"(V) 了 ,这 样 ,就 可 进一步 讨论 在 无 偏 性 和 最 优 性 的 条 件 下 ,如 何 确定 线性 估计 量 的 各 个 权 
BALA, 的 问题 (也 就 是 确定 函数 /) 了 。 


二 、 无 偏 性 条 件 和 线性 估计 方差 


1. 无 偏 性 条 件 

采用 如 同 式 (6 - 7) 线 性 估计 形式 ,在 满足 无 偏 性 和 最 优 性 条 件 下 , 即 可 求 出 权 系 数 à o 
无 偏 性 条 件 要 求 估计 值 的 期 望 值 与 真实 值 的 期 望 值 相等 , 即 E[ Z"(V)] = E[Z(V)], 下 面 讨 
论 两 种 情况 下 无 偏 性 条 件 的 满足 问题 。 

DA E[Z(x)] 为 一 已 知 的 常数 „ 时 的 无 偏 性 条 件 

此 时 ,考察 Z’ (x)= Z(x) - Ap, 由 于 Z(x) 为 二 阶 平稳 区 域 化 变量 ,所 以 Z“(x) 也 是 二 阶 
平稳 区 域 化 变量 , 且 E[ Z “(x)] =0。 

在 估计 问题 中 ,只 要 能 对 Z “(x) 在 待 估 域 Y 中 的 变量 值 Z …“ (VY) 进行 估计 ,就 可 以 通过 
转换 Z(x) = Z (x) + p 对 Z(x) 在 待 估 域 V 中 的 变量 值 Z"(V) 进 行 估计 。 此 时 ,我 们 把 式 
(6 - 7) 转换 为 如 下 形式 


230) = hz = Vf Za (6-8) 
名 ia Yide 
现在 ,我 们 来 讨论 无 偏 性 条 件 的 满足 问题 。 
一 方面 ,估计 值 2'“ (Y) 为 一 随机 变量 ,其 期 望 值 为 
ELZ’ (0] = [5 Zf z'oa] $ Èf glz'(Wld =0 (6-9) 
另 一 方面 ,真实 值 也 是 一 随机 变量 ,其 期 望 值 为 
E(Z'(V] = p| ELZ*GOJdy = 0 (6 - 10) 


由 式 (6-9) 和 (6- 1008] W, ELZ’ (V)]=ELZ (VD)] 自 然 成 立 , 即 当 E[Z(x)] 为 一 已 
知 的 常数 „a 时 ,无 偏 性 条 件 自然 得 到 满足 。 
2) 当 E[Z(x)] 的 值 未 知 时 的 无 偏 性 条 件 
-方面 ,估计 值 Z” (Vy) 为 一 随机 变 基 ,其 期 望 值 为 


ELZ (W] = LX; Hf zear) Ź 3 z] elza z > A] pa S Dau 
6-11) 


另 一 方面 ,真实 值 也 是 一 随机 变量, 其 期 望 值 为 
E[(Z(W] = pf ELZGDJAY = m (6 - 12) 


要 使 E[Z"(V)]= ELZ(V)], 必 须 使 
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Sa, =1 
A 


2. 无 偏 性 条 件 满足 的 前 提 下 线性 估计 方差 的 计算 公式 
在 无 编 性 条 件 满足 的 前 提 下 ,估计 方差 的 计算 公式 为 


gk = E[Z(W) -2Z (V)? = EX[Z(V) - p] - [Z*(V)- al]? 
= E[Z(W) -Ap + ELZ (V) - p}? - 2EL[Z(V) -ALZ (V) - p] 
= kj, co - y')dydy’ + P2 f fee - t')dtdt" 
-25 gf co - Dayar 
4 
让 [co - Ddydt = cvw) 
4j fco- y')dydy’ = C(V,V) 
zaj, |, CE - t/)dtdt" = C(v,,v,) 
则 有 


os = C(V,V) + D DAA tly) - 2 NGCCwa) 
名 名 A 


(6 - 13) 


(6 - 14) 


(6 - 15) 


str, C(V, 由) 代表 当 线段 的 两 个 端点 分 别 独 立地 扫 过 整个 了 时 ,所 得 变 差 函数 的 平均 
值 ;5(w,w) 代 表 当 线段 的 两 个 端点 分 别 独立 地 扫 过 w 和 vw 时 ,所 得 变 差 函数 的 平均 值 ; C 


(Yuw) 代 表 当 线段 的 两 个 端点 分 别 独立 地 扫 过 Y 和 vw 时 ,所 得 变 差 函数 的 平均 值 。 


F v 表示 所 有 的 w, 则 有 


六 MG) = C(V,v) 


立定 (wa) = C(0,v) 
估计 方差 计算 公式 (6- 15) 可 简写 为 
oz = C(V,V) + C(v,v) - 2C(V,v) 


3. 关 于 估计 方差 的 几 点 说 明 


(6 - 16) 


(1) 当 信息 域 "包含 在 待 估 域 了 中 时 ,估计 方差 又 称 为 外 延 方 差 , 记 为 oV, v); 


(2) 不 论 H V 是 怎样 的 域 ,公式 (6 - 16) 皆 适用 ; 


(3)7( 人 = 于 ELZ(x) - Z(x+h) 了 可 看 作 是 用 Z(x+h) 估 计 Z(x) 的 估计 方差 之 半 ; 
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(4)ct 的 大 小 可 用 来 衡量 估计 量 的 优 劣 ,cz 越 小 ,估计 值 越 精确 ,反之 亦 然 ; 
(5) 估 计 方 差 公 式 是 在 Z”(V) 为 诸 z(w ) 的 线性 组 合 这 种 很 一 般 情况 下 推导 出 来 的 ,推导 


中 必须 加 上 Na = 1 这 一 前 提 , 这 样 2”(VY) 就 可 看 成 是 诸 z(w ) 以 诸 4, 为 权 的 加 权 平 均 ; 


(60 有 4 个 影响 因素 : 〇 DY 与 v 之 间 的 距离 ;DY 的 几何 特征 ;@v 的 几何 特征 、 数 量 和 
空间 分 布 ;@Y(4) 的 特性 。 


第 二 节 ” 克 立 金 方法 


一 、 简 单 克 立 金 方法 


当 E[Z(x)] 为 一 已 知 的 常数 py 时 ,引出 简单 克 立 金 方法 ,此 时 ,无 偏 性 条 件 自然 满足 , 信 
计 问 题 转化 为 估计 方差 最 小 时 , 求 取 式 (6 - 8) 中 的 参数 A, ,此 问题 即 为 求 极 值 问题 ,我 们 有 
dat, 


Jà: 
把 式 (6 - 17) 整 理 后 得 


= 25A lny) -2 Vu) =0 (i = 1,2,**,n) (6 - 17) 
m 


Daon) =CWwv)  (i=1,2,*,n) (6 - 18) 
式 (6 18) 即 为 简单 克 立 金 方程 组 ,其 建立 过 程 的 实质 是 最 小 -乘法 的 应 用 。 解 该 方程 
组 ,就 可 得 到 系数 1,(i = 1,2, ,n) ,代入 式 (6-8) 就 可 对 Z "(YY) 进 行 估计 ,进而 利用 Z(x) 
=Z'(x)+y, 就 可 对 2Z"(V) 进 行 估计 ,得 到 的 估计 值 即 为 简单 克 立 金 估 计 值 , 记 为 Z4(VY)。 
二 ,普通 克 立 金 方法 
普通 克 立 金 法 是 一 种 线性 无 偏 最 优 估计 ,采用 式 (6 - 7) 的 线性 估计 形式 ,无 偏 条 件 为 
Na = 1 最 优 " 即 要求 估 计 方差 o 最 小 ,这 就 涉及 在 Sa, = 1 条 件 满足 的 前 提 下 , 求 条 件 
极 值 的 问题 。 求解 条 件 极 值 问题 要 用 Lagrange 乘 数 法 , 即 构造 -个 新 的 函数 
F = o -2800 -1) 


= COW + E YAA y) - 20AE(W,w) -260a 1) (6-19) 


式 中 , 为 Lagrange( 拉 格 朗 日 ) 算 子 。 
函数 FFA 和 & 求 导 , 使 导数 等 于 0, 可 得 到 (n+ 1) 元 方程 组 


z = ZYĄCO,,) - 20(V,,) -2850 (i = Lyn) 
(6 - 20) 
2F 


JE -AXA -D =0 


把 上 式 整 理 后 得 到 普通 克 立 金 方 程 组 
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Batou) -= 0V»)  (i=1,2,*,n) 


m 


Ża = 1 
普通 克 立 金 方程 建立 过 程 的 实质 是 最 小 二 乘法 的 应 用 。 解 普通 克 立 金 方 程 组 可 得 到 A, 
(i=1,2,…,n) 和 &,X;(i=1,2,…,n) 称 为 普通 克 立 金 系数 ,把 A;(i=1,2,…,n) 代 入 到 线性 
估计 式 (6- 7) 中, 即 可 得 到 待 估 域 Y 中 变量 的 估计 值 Z” CV) ,得 到 的 估计 值 即 为 普通 克 立 金 
估计 , 记 为 Z3( ;同时 ,把 A.(i=1,2,…,n) 直 接 代 入 到 式 (6- 16) 中 ,又 可 得 到 估计 方差 值 ， 
该 估计 方差 称 为 普通 克 立 金 方差 , 记 为 oa (V), B 


9,(W) = (V, D+ Naci. W) -2AE.v) (6 - 22) 
1 


式 (6- 22) 中 存在 双重 求 和 项 ， 在 计算 - 上 比较 复杂 ， 下 面 我 们 推导 出 普通 克 立 全 方差 的 一 
个 比较 简单 的 表达 方式 。 
在 普通 克 立 金 方程 组 [ 式 (6 - 21) ] 两 端 同时 乘 以 A; 并 从 i=1 到 n 求 和 得 


Ń AE 1) = €+ DECA (6 - 23) 
把 式 (6- 23) 代 入 式 (6- 22) 中 ,可 得 到 普通 克 立 金 方 差 的 一 个 简化 表达 形式 


(6-21) 


(W) = CWW) - DACW.w) + E (6 - 24) 
A 


三 \ 普 通 克 立 金 方程 组 和 克 立 金 方差 的 其 它 表 达 形 式 


1. 使 用 变 差 函 数 时 的 普通 克 立 金 方程 组 和 普通 克 立 金 方差 
把 关系 式 Y(h) = C(0) - C(h)[ 见 式 (5 -15)] 代 入 到 式 (6-21) 和 (6 - 24) ,整理 后 得 到 用 
变 差 函数 表达 的 普通 克 立 金 方程 组 和 普通 克 立 金 方差 


Dawny) tE =YV)  (i=1,2,*,n) 





` (6 - 25) 
DA =1 
GW) = DAF) - FW,V) + 6 (6 - 26) 


2. 当 样品 承载 为 点 承载 时 的 普通 克 立 金 方程 组 和 普通 克 立 金 方差 
H v, 非常 小 时 ,可 看 作 点 承载 或 准点 承载 ,普通 克 立 金 方程 组 和 普通 克 立 金 方差 表示 为 


Darasa) +E=TUV,x) (i =1,2,,n) 
w (6 - 27) 


Nasi 
AV) = DAI, a) -7W,V) + 6 (6 - 28) 


s Le 





3. 当 待 估 域 V 为 点 x 且 样品 承载 为 点 承载 时 的 普通 克 立 金 方程 组 和 普通 克 立 金 方差 

图 6- 1 所 示 的 问题 ,在 克 立 金 方法 体系 中 , 称 为 块 克 立 金 法 , 即 对 待 估 域 Y 内 的 变量 值 
进行 估计 ,其 实质 是 估计 出 变量 在 待 估 域 内 Y 的 平均 值 。 当 待 估 域 为 点 x 时 , 且 样品 承载 为 
点 承载 时 的 普通 克 立 金 方程 组 和 普通 克 立 金 方差 有 如 下 形式 


DAN) +E lai) (= 12,1) 


a (6 — 29) 
DNA =1 
名 
cy(x) = 297625) + E (6 - 30) 
4. 普 通 克 立 金 方程 组 和 普通 克 立 金 方差 的 矩阵 表示 形式 
式 (6 -29) 和 (6 - 30) 用 和 抢 阵 形式 表达 时 , 先 构筑 矩阵 
A; Y(a, x) Ylxy,x,) Ylxyra)""Y(x,x,) 1 
A, Yaza) Y(xa,xi) Yla,2)""Y(32,2,) 1 
[la e] [M] … [Kl]  *** (6 - 31) 
A, Y(x,,x) Vansa) Y(x,,3)"*7(2,,x,) 1 
Ę 1 1 1 3% 1 0 
则 普通 克 立 金 方程 组 可 写 为 
[K][A] = [M] (6 - 32) 
普通 克 立 金 方程 组 的 系数 可 用 下 式 求 取 
[a] =[KI"[M] (6 - 33) 
普通 克 立 金 方差 表示 为 
oa(x) = [A]'[M] (6 - 34) 


和 矩阵 [K] 为 数据 构 形 ,代表 样品 点 x, 之 间 的 空间 配置 关系 ,矩阵 [ M ] 为 估计 构 形 ,代表 待 
估 点 x 与 x(i=1,2,…,n) 之 间 的 空间 配置 关 系 。 


四 、 普 通 克 立 金 计算 实例 分 析 
【 例 6- 1】 有 一 区 域 化 变量 Z(x) ,其 变 差 函 数 为 
Et 0 (h = 0) 
ga | w =t (0 < h < 200m) 
| 1 (h > 200m) 
O; 


对 于 待 估 点 x 对 称 分 布 ,各 样品 点 与 待 估 点 x 之 间 的 
距离 为 0m, 试 求 用 样品 点 对 待 估 点 进行 估计 的 普通 
i RA | 克 立 金 系数 和 普通 克 立 金 方差。 
解 :建立 用 乱 阵 形式 表达 的 普通 克 立 金 方程 组 M 
要 知道 数据 构 形 矩阵 [K] 和 估计 构 形 短 隆 [ MM] 的 各 元 
图 6-2 例 6-1 MERR 。。” 索 [ 见 式 (6-31)], 计 算 如 下 : 
-120 + 


| or o. | 设 样品 点 为 ma 233 ,x( 图 6-2),4 个 样品 点 相 





70.71 70.76 








Y(t) = Vaaa) = ya) = (ay) = 2 x igi - 3 og = 0.51 
Y(x,33)= Y(x3,x,) = 4 x 10 = 0.69 


Yasa) = Ż x150 =0.37 (i = 1,2,3,4) 


有 了 数据 构 形 矩阵 [K] 和 估计 构 形 矩阵 [W ] 后 ,普通 克 立 金 系数 和 普通 克 立 金 方 差 求 取 
WF: 

[à] = [K] [M] = [0.25,0.25,0.25,0.25, - 0.06] 

0.37 

0.37 
oa(x) = [A]7[M] = [0.25,0.25,0.25,0.25, ~ 0.06]| 0.37 | = 0.31 

0.37 

1 

将 求 得 的 系数 Xi(i = 1,2,3,4) 代 和 人 式 (6 - 7) 即 可 得 普通 克 立 金 估计 值 


Zy(x) = Siaa = 0.5[z(x,) + z(x2) + z(x3) + z(x4)] 
m 


五 .普通 克 立 金 分 析 方 法 的 特点 


1. 普 通 克 立 金 方程 组 及 方差 的 特点 
(1) 解 的 存在 性 和 惟一 性 问题 :只 要 C(h) 是 正定 的 或 - y(h) 是 条 件 正定 的 , 则 克 立 金 方 
程 组 且 只 有 一 组 解 。 
(2) 克 立 金 估 值 是 一 种 无 偏 的 内 插 估 值 ,在 样品 点 克 立 金 估 计 值 等 于 实测 值 ,估计 方差 为 
0, 即 
Zalvi) = a(n) (i=1,2,**n), a(n) =0 


(3) 表 达 式 具有 通用 性 :不 论 数据 承载 w w, 和 待 估 承 域 Y 的 大 小 和 形状 如 何 ,不 论 Ch) 
或 Y(h) 所 表征 的 结构 如 何 ,表达 式 均 适 用 。 

(4) 普 通 克 立 金 方程 组 和 方差 考虑 了 以 下 4 方面 的 因素 :DY 的 几何 特征 ;@w 与 V 之 间 
的 空间 配置 关系 ;@ 数 据 构 形 的 几何 特征 ;@@ 以 变 差 函数 来 表现 的 区 域 化 变量 的 空间 结构 特 
征 。 

(5) 普 通 克 立 金 佑 计 不 依赖 十 样品 数据 z(w ) 的 具体 数值 ,一 旦 估计 构 形 和 变 差 函 数 已 知 ， 
则 在 开 钴 之 前 就 可 解 出 普通 克 立 金 权 系数 及 相应 的 方差 。 这 样 ,就 可 利用 补 打 新 钼 孔 后 克 立 
金 方差 减少 的 数量 来 衡量 补 打 该 钴 孔 的 效果 ,从 而 确定 最 优 布 孔 方案 。 

(6) 数 据 构 形 矩 阵 [K] 只 依赖 于 变 差 函数 和 数据 构 形 ,在 对 不 同 待 估 域 的 变量 值 进行 估 计 
时 ,数据 构 形 是 不 变 的 。 

(7) 普 通 克 立 金 方程 是 在 线性 无 偏 和 最 优 条 件 下 推导 出 来 的 ,从 实质 上 来 看 ,是 最 小 二 乘 
法 的 应 用 ( 见 第 三 章 ), 所 以 , 克 立 金 方程 组 也 可 看 作 是 广义 的 线性 回归 方程 。 
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2. 普 通 克 立 金 系数 的 特点 

(1) 对 称 性 :由 变异 函数 的 对 称 性 可 以 推 知 ,相对 于 待 估 点 ,空间 位 置 对 称 的 两 个 样品 点 ， 
其 权 系数 是 相同 的 ,如 在 图 6- 3(a) 中 ,两 个 样品 点 相对 于 待 估 域 的 位 置 是 对 称 的 , 两 个 样品 
点 的 权 系数 是 相同 的 。 

(2) 屏 项 效应 (sereen effect) : LUFA 6 — 3(b) 所 示 , 当 有 一 个 样品 点 靠近 待 估 域 时 ,其 作用 则 
屏蔽 了 离 待 估 域 较 远 样品 点 的 作用 ,图 中 下 方 样品 点 的 作用 就 受到 新 加 入 样品 点 (实心 点 ) 的 
屏 项 ,其 克 立 金 权 系数 减 小 。 


| : 
O | © 


o | | o 








(an 对称 性 (b) 屏蔽 效应 


图 6-3 克 立 金 权 系数 的 特点 示意 图 

(3) 克 立 金 权 系数 可 正 可 人 负 : 克 立 金 权 系数 A, 可 为 正 值 ,这 是 最 常见 的 情况 ,但 有 时 会 出 
BW A, 为 负 值 的 情况 。 

3. 普 通 克 立 金 法 的 优 缺 点 

(1) 克 立 金 估 计 比 传统 方法 要 精确 ,至少 可 以 避免 系统 误差 ; 

(2) 不 仅 给 出 一 个 估计 值 ,而 且 可 同时 给 出 估计 方差 oa Ca) R o%(v), 而 估计 方差 可 作为 
估计 精度 的 一 个 衡量 指标 ; 

(3) 用 “统计 距离 "代替 几何 距离 ,能 考虑 空间 点 之 间 的 配置 以 及 结构 性 特征 ; 

(4) 可 以 消除 从 集 效应 :在 图 6- 4 中, 下方 有 4 个 密集 分 布 的 样品 点 ,这 4 个 样品 点 的 权 
系数 之 和 几乎 和 上 方 一 个 样品 点 的 权 系数 相同 ; 

(5) 用 结构 模型 ,可 以 更 好 地 考虑 定性 信息 的 影响 :在 变 差 函数 拟 合 过 程 中 ,人 们 对 变量 在 
各 向 异性 等 方面 的 地 质 认识 ,可 以 指导 人 们 在 模型 选择 等 方面 的 工作 ,而 变 差 函数 对 克 立 金 估 
值 有 直接 影响 ; 

(6) 可 以 直接 用 一 个 克 立 金 方程 组 估计 块 段 上 的 平均 值 或 某 一 点 上 的 变量 值 , 非常 
方便 ; 

(7) 系 数 可 正 可 负 ,使 估 值 范围 可 超出 实测 值 范围 ; 

(8) 经 典 统计 学 考虑 的 是 克 立 金 方法 的 特例 ,而 克 立 金 方法 是 经 典 统计 学 的 发 展 , 当 区 域 
化 变 基 是 纯 随机 变量 时 , 克 立 金 估计 等 同 于 用 经 典 统计 学 进行 的 平均 值 估 计 法 。 

克 立 金 估计 方法 的 缺点 是 ,计算 工作 量 大 ,然而 , 随 着 计算 机 技术 的 迅速 发 展 ,这 一 缺点 已 
变 得 不 明显 。 
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图 6- 4 减弱 从 集 效应 示意 图 
六 、 普 通 克 立 金 应 用 实例 分 析 














图 6-5 塔里木 盆地 轮 南 凸 起 中 部 超 压 压力 系统 
实测 地 层 压力 系数 分 布 图 和 和 桑 塔 木 断裂 (图 中 粗 实 线 ) 所 在 位 置 示意 图 

我 们 收集 了 48 口 井 的 数据 ,在 第 五 章 实例 所 示 的 结构 分 析 的 基础 上 ,对 其 中 15 口 井 的 压 
力 值 用 本 章 介绍 的 普通 克 里 金 方 法 进行 了 估计 ,并 与 实测 值 进行 了 对 比 一 一 交叉 验证 ( 表 
6- 1)。 由 表 6-1 可 见 , 有 10 口 井 的 顶 测 精度 大 于 90% ,有 3 口 井 的 预测 精度 在 88% ~ 90% 之 
间 , 只 有 两 口 井 的 预测 精度 在 86% ~ 88% 之 间 ,总 的 来 看 , 克 立 金 法 预测 的 精度 高 ,能 满足 压 
力 预 测 的 工程 需要 。 
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表 6-1 塔里木 盆地 轮 南 凸 起 中 部 超 压 压力 系统 普通 克 立 金 估计 值 与 实测 值 对照 表 





























































kos | Em | EM 绝对 误差 预测 精度 
轮 南 3 1.143 | 0.055 ||| 93,8% 
轮 南 54 1.070 0.000 100.0% 
轮 南 46 1.105 0.020 98.2% 
轮 南 32 1.212 0.070 99,4% | 
轮 南 21 1.161 0.029 97.5% | 
mB | 1.264 0.013 99.0% 
| mim 1.226 ow | six 
轮 南 16 1.205 om | 88.2% 
轮 南 53 1.206 |= 0.094 92.2% z 
轮 南 51 1.247 0.171 863% | 
轮 南 上 1.261 0.060 95.2% 
轮 南 59 | 1.355 0.139 89.7% E 
解放 126 ; 1206 0.133 89.0% 
EE 
86.8% 














预测 精度 稍 低 的 两 口 井 一 一 轮 南 51 井 和 解放 124 并 位 于 又 塔 木 断裂 带 附 近 ( 图 6 - 5)。 
断裂 带 附近 地 层 的 孔 渗 性 得 到 改善 ,断裂 带 又 常常 是 汇 压 的 通道 ,在 断裂 带 附近 压力 分 布 得 到 
~ 定 程度 的 调整 , 克 立 金 方法 在 进行 压力 预测 时 ,所 能 考虑 的 是 地 层 压 力 区 域 化 变量 在 其 空间 
域 中 的 整体 的 结构 性 状 ,而 无 法 考虑 在 断裂 带 附近 地 层 压力 受 局 部 扰动 所 出 现 的 局 部 性 结 
特点 ,这 就 导致 克 立 金 方 法 在 断裂 带 附 近 预 测 的 精度 要 低 一 些 。 


第 三 节 ”指示 克 立 金 方 法 








一 、 指 示 克 立 金 法 的 产生 


上 节 讨 论 的 普通 克 立 金 方法 ,是 一 个 十 分 有 效 的 内 插 估计 方法 ,对 解决 变量 的 空间 展 布 问 
题 很 有 用 。 但 在 实际 地 质问 题 中 ,常常 还 会 遇 到 另外 一 类 问题 ,如 矿产 资源 的 可 采 储量 计算 问 
题 ,要 解决 这 类 问题 ,需要 知道 某 一 点 或 某 一 区 域 矿石 品位 大 于 某 一 给 定 值 的 概率 ,或 者 说 需 
要 知道 x 点 处 随机 变量 Z(x) 的 概率 分 布 (图 6- 6) ,在 假设 变量 不 存在 空间 结构 性 的 条 件 下 ， 
事件 | Z(x) 三 aa/(n)i 出 现 的 概率 等 于 事件 jz(x ) 大 aa)iGi=12n) 出 现 的 比例 。 如 在 
图 6-7(a) 中 , 待 估 点 变量 Z(x) <9 的 概率 为 0.6。 

但 对 地 质变 量 而 言 , 绝 大 多 数 具 有 空间 相关 性 ,要 解决 x 点 处 随机 变量 Z(x ) 的 概率 分 布 
问题 ,就 需要 引入 新 的 方法 ,指示 克 立 金 法 正 是 为 解决 此 类 问题 而 发 展 起 来 的 。 


二 、 指 示 克 立 金 方法 原理 


1. 指 示 转 换 ( 指 示 编 码 ) 
现在 ,对 于 任意 给 定 的 阔 值 a ,引入 (定义 ) 指 示 函 数 ,对 每 个 信息 (样品 ) 点 x, 有 
0 if zx) > 


Masz) = |] if at) (i=1,2,**,n) (6 - 35) 
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图 6-7 原 变量 对 不 同 阔 值 3 的 指示 转换 
原 变量 [图 6- 7(a)] 相 对 于 不 同 的 阔 值 : ,有 不 同 的 指示 转换 [图 67(b),6-7(c),6-7(d)]。 
指示 转换 函数 Iaa) (k = 1,2,…,K) 有 明确 的 物理 含义 , 它 实际 上 是 信息 (样品 ) 点 x, 
处 随机 变量 Z(x ) 的 概率 分 布 函数 (图 6- 8) , 即 
Flxix,) = PIZ(z) z al 
2an) = (4 A a (k=1,2,,K) (6-36) 
2. 指 示 协 方差 函数 和 变 差 函数 
指示 转换 函数 同样 可 看 作 是 一 个 区 域 化 变量 ,可 与 区 域 化 变量 相同 的 形式 定义 指示 转换 
函数 的 协 方差 函数 和 变 差 函数 , 即 
”4 





Fta,;2) 








O 


z(2) z 


图 6- 8 指示 转换 函数 (xi ;z) 是 信息 (样品 ) 点 x, 处 随机 变量 Z(x, ) 的 概率 分 布 函数 
C,;(h;z)= Col lI(x;z,),I(x + h;z,)| 


= Ell(x;a,) - ELI(xzz)]HI(x + hiz) — ELI(x + h;z,)]! 
(Vx,yh k=1,2,"*,K) (6 - 37) 
RP, h 代表 两 个 点 x 和 x +h 之 间 的 距离 ,以 下 各 公式 中 的 含义 同 此 。 


Yihsn) = Zal Ilasz) - Mx + hin)] (k= 1,2,.,K) (6 - 38) 


在 二 阶 平稳 假设 条 件 下 , 指 赤 协 方差 函数 和 指示 变 差 函数 表示 为 如 下 形式 
Ci (hiz) = Cof I(x), T(x + h;z)} 


= ElMazz)I(x + hsa)] -pe (k=1,2,..,K) (6 - 39) 
yhsa) = 二 EL1(xia) - Ix + hi) (k = 1,2,,K) (6 ~ 40) 


在 二 阶 平 稳 假 设 条 件 下 ,指示 协 方差 函数 和 指示 变 差 函 数 之 间 存 在 以 下 关系 
Ylhiz) = C(0;2,) - C (h;a) (k = 1,2,**,K) (6 - 41) 
指示 实验 变 差 函 数值 可 用 下 式 求 取 


A) 
7; hin) = RCR) Dlana) - Ma + hia)? (k=1,2,,K) (6-42) 
RP, N(h) 为 相距 为 h 的 数据 点 对 的 个 数 。 
指示 变 差 函数 的 拟 合 与 前 面 已 介绍 过 的 区 域 化 变量 变 差 函 数 拟 合 的 原理 和 步骤 完全 一 样 
( 见 第 五 章 ) ,在 此 不 再 著述 。 
3. 指 示 克 立 金 方程 组 
在 引入 指示 转换 函数 后 ,假设 变量 无 空间 结构 性 的 条 件 下 ,x 点 处 随机 变量 Z(x) 的 概率 
分 布 函数 可 由 下 式 估 计 
Flxzz(n)| = PIZ(x) < z/(n)| 
= LE Nasa) Vx (k=1,2,=,K) (6 - 43) 
RP, F dz, An PEAR) (i=1,2,…,n) 的 函数 。 
在 变量 存在 空间 结构 性 的 条 件 下 (常见 的 情况 ) ,估计 x 点 处 随机 变量 Z(x) 的 概率 分 布 函 
数 就 不 这 么 简单 ,此 时 需要 引用 指示 克 立 金 方法 。 
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在 考虑 变量 的 空间 相关 性 时 , 则 有 
Flx;zi(n)| = PIlZ(x) < z/(n)| = Da (xia) Ixa) (k = 1,2,7, K) (6-4) 


式 (6-36) 和 (6- 44) 38H „zK F | x; am)1 可 以 看 作 是 用 已 知 的 (xi;z) 来 估计 未 知 的 
I(xszzy)o 


用 严格 的 概率 论 理论 可 以 证 明 ， Za (x325) I(x,;z,) 确 是 已 知 个 数据 时 Z(x) 的 条 件 
概率 分 布 函数 ,或 是 1(x;2) 的 线性 估计 ， LU 


Fizzą/(n)| = I" (zi4) = Bx (x322)1(x.3%) (6 - 45) 
给 定 任 一 点 x 和 任 一 阔 值 zx , 可 建立 指示 克 立 金 方程 组 


Pars) = wszy) + Elza) = V(x - xz) 
z (6 ~ 46) 
Dala) =1 (i=1,2,'*,n) 
RIP, y, 代表 指示 变 差 函 数 ;x; - x 代表 两 个 样品 点 之 间 的 距离 ;x - xi 代表 待 估 点 x 和 样品 
点 之 间 的 距离 。 
解 指示 克 立 金 方程 组 (6 - 46) 得 到 系数 (xz;za)(i= 1,2,，…，n) 和 6(x;z), 代 人 到 式 (6 
-45) 中 , 即 可 求 出 1" (x;z)。 
一 般 把 z(x,) (i=1,2,…,n) 分 成 个 阐 值 2,,z,,…, zx, 故 在 每 一 点 x 上 ,用 个 指示 
克 立 金 方程 组 需求 解 ,可 得 到 个 1 (x;z,) 估 计 值 ,这 个 1"(x;z) 估 计 值 分 别 对 应 待 估 点 
x 处 随机 变量 Z(x) 小 于 zy ,z,,… ,zx 的 概率 (图 6 -9)。 











图 6-9 (x; 有 a4) 一 4a(k=1,2,…,K) 关 系 曲线 即 为 x 点 处 
随机 变量 Z(x) 的 概率 分 布 曲线 

对 不 同 的 点 ,可 以 得 到 不 同 的 概率 分 布 曲线 ,由 这 些 不 同 的 概率 分 布 曲线 ,可 读 出 区 域 化 
变量 Z(x) 在 不 同 点 出 现 小 于 某 一 值 x。 的 概率 ,由 此 可 绘制 出 等 概率 图 (图 6- 10)。 也 可 以 根 
据 不 同 点 的 概率 分 布 曲线 ,事先 确定 一 个 概率 值 P. ,绘制 变量 等 值 线 图 ,在 变量 等 值 线 图 上 可 
以 读 出 区 域 化 变量 Z(x) 以 P. 为 概率 的 取 值 (图 6- 11)。 等 概率 图 和 变量 等 值 线 图 皆 反 映 区 
域 化 变量 的 不 确定 性 。 

4. 指 示 克 立 金 对 “ 软 数 据 ” 的 利用 

以 上 所 用 到 的 观测 点 的 数据 皆 为 一 确定 的 实数 ( 见 图 6-7) ,我 们 称 为 “ 硬 数 据 ", 在 地 质 
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图 6- 10 等 概率 图 
图 中 的 值 为 区 域 化 变量 Z(x) < z. 的 概率 ,z. 为 某 - -给 定 的 值 














图 6-11 变量 取 值 等 值 线 图 
图 中 的 值 为 区 域 化 变量 Z(x) 以 P, 为 概率 的 取 值 
研究 中 ,还 常常 磁 到 另外 一 类 数据 ,如 已 知 某 一 点 的 变量 值 落 在 某 个 区 间 内 zC) E (a,b) ,或 
服从 某 一 分 布 P1 Z(xi)<ajl = F(xiiza)E(0,1), 这 类 数据 称 为 " 软 数据 "。 如 图 6 - 11 为 图 
6- 7(a) 加 入 一 个 新 信息 (样品 ) 值 ,该 值 在 6~ 8 之 间 变 化 (图 6- 12 中 划 底 线 的 值 ) 。 

指示 克 立 金 可 以 利用 这 些 软 数据 中 包含 的 信息 ,这 是 其 它 方法 所 没有 的 功能 ,在 指示 转换 
中 ,这 一 新 的 软 数据 得 到 了 利用 , 见 图 6- 12 中 的 (c),(d)。 

5. 关 于 指示 克 立 金 的 几 点 说 明 

(1) 指 示 克 立 金 法 的 目的 是 给 出 区 域 化 变量 在 空间 某 一 点 处 随机 变量 的 概率 分 布 曲线 ,从 
而 一 方面 可 对 变量 的 不 确定 性 进行 度量 , 另 一 方面 又 可 给 出 变量 值 大 于 (或 小 于 ) 某 一 给 定 值 
的 概率 ,可 解决 诸如 可 采 储量 估计 这 类 问题 ;在 得 到 一 个 估计 前 独立 地 求 出 概率 分 布 ,以 表征 
变量 的 不 确定 性 。 估 计 值 有 多 种 ,但 概率 分 布 估计 只 有 一 种 。 

(2) 指 示 克 立 金 法 的 目的 不 是 得 到 一 个 最 优 估计 ,而 是 得 到 待 估 点 随机 变量 的 概率 分 布 曲 
线 ,以 便 对 不 确定 性 进行 衡量 。 在 指示 克 立 金 中 ,不 确定 性 以 概率 分 布 的 形式 来 表示 ,与 普通 
克 立 金 法 用 克 立 金 估 计 方 差 表示 不 确定 性 是 不 同 的 。 

(3) 指 示 克 立 金 法 是 非 线性 和 非 参数 的 估计 :尽管 指示 克 立 金 方程 组 是 线性 方程 组 ,但 由 于 
指示 转换 本 身 是 一 个 非 线 性 转换 ,所 以 ,指示 克 立 金 估计 是 非 线性 估计 。 指 示 克 立 金 对 变量 的 概 
率 分 布 模型 没有 任何 要 求 , 变 量 的 分 布 可 以 是 任 一 模型 , 故 指示 克 立 金 是 一 种 非 参 数 估 计 。 
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图 6-12 在 图 6-7 中 加 入 一 个 软 数据 后 的 指示 转换 情况 
(4) 指 示 克 立 金 法 可 以 利用 * 软 数据 ", 这 是 其 它 方法 所 不 具备 的 优点 。 
(5) 指 示 克 立 金 法 既 可 用 于 连续 型 变量 ,也 可 用 于 离散 型 (属性 ) 变 量 。 
三 ,指示 克 立 金 应 用 实例 分 析 


美国 西 维 吉 尼 亚 中 部 Granny Creek 油田 在 1924 年 ~ 1960 年 进行 了 开发 ,从 下 密西西比 
Price 组 顶部 砂岩 储 层 中 累计 产 油 650 万 桶 ,获得 了 大 量 开 发 资料 。 为 了 搞 清 控 制 Price 组 顶部 
砂岩 储 层 单 井 初始 产量 的 地 质 因素 ,需要 对 单间 初始 产量 在 平面 上 的 分 布 进行 研究 和 定量 描 
述 。 

把 Granny Creek 油田 单 井 初始 产量 作为 区 域 化 变量 ,图 6- 14 为 对 应 不 同 阔 值 的 指示 变 差 
函数 ,其 计算 步骤 是 先 按 式 (6 - 35) 进 行 指示 转换 (指示 编码 ) ,再 按 式 (6 - 38) 计 算 实验 指示 变 
差 函 数 并 进行 函数 拟 合 (图 6- 13 中 的 实 线 )。 

按 上 述 步 又 ,通过 指示 克 立 金 计算 ,可 得 到 Granny Creek 油田 Price 组 顶部 砂岩 储 层 单 井 初 
EAK FE ERE ER RERE 6- 14) ,图 6- 14(a) 和 (b) 分 别 为 单间 初始 产 基 大 于 
10 桶 /天 和 大 于 15 桶 /天 的 概率 等 值 线 图 。 

图 6- 14 提供 了 关于 Granny Creek 油田 Price 组 顶部 砂岩 储 层 单 井 初始 产量 分 布 的 综合 
信息 ,反映 了 单间 初始 产量 在 平面 上 的 变化 ,根据 单 并 初始 产量 在 平面 上 的 变化 情况 ,就 可 以 
进一步 研究 Price 组 顶部 砂岩 储 层 单间 初始 产量 的 地 质 控制 因素 ,为 邻 区 该 储 集 层 的 勘探 开发 
部 署 提 供 重 要 的 参考 依据 。 
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图 6-13 Granny Creek 油田 Price 组 顶部 砂岩 储 层 单 井 初始 产量 
区 域 化 变量 对 应 不 同 阔 值 的 指示 变 差 函数 

















(a) 初始 产量 超过 去 10 桶 / 天 的 概率 等 值 线 CO) 初始 产量 超过 去 15 桶 / 天 的 概率 等 值 线 
图 6- 14 Granny Creek 油田 Price 组 顶部 砂岩 储 层 单间 初始 产量 大 于 某 一 赣 值 的 概率 等 值 线 图 
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令 思 考 和 练习 题 合 


1 .估计 的 一 般 形式 是 什么 ? 为 什么 要 采用 线性 估计 形式 ? 

2 .尝试 推导 普通 克 立 金 方程 。 

3. 克 立 金 法 有 哪些 优 缺 点 ? 

4. 为 什么 说 克 立 金 法 是 一 种 线性 、 无 偏 和 最 优 的 估计 ? 

5. 克 立 金 方程 组 有 了 哪些 特点 ? 

6. 如 何 理解 克 立 金 方 差 ? 

7. 指 示 转换 的 物理 含义 是 什么 ? 

8. 指 示 克 立 金 法 有 哪些 优点 ? 

9. 指 示 克 立 金 和 普通 克 立 金 有 何不 同 ? 

10. 在 图 6- 12 中 , 当 新 信息 (观测 ) 点 的 取 值 在 10 ~ 13 之 间 变 化 时 ,如 何 进 行 指示 转换 ? 


< Bie 





BEM ”区域 化 变量 的 随机 模拟 


本 章 学 习 目的 和 要 求 :掌握 连续 变量 、 离 散 变 量 随机 模拟 和 退火 模拟 的 基本 原 
理 , 了 解 其 在 油气 藏 参数 模拟 中 的 应 用 。 学 习 本 章 内 容 ,第 五 章 一 第 六 章 的 知识 是 必 
不 可 少 的 ,同时 也 需要 了 解 第 二 章 中 联合 概率 分 布 的 概念 。 


第 一 节 区域 化 变量 随机 模拟 简介 


一 、 模 拟 及 模拟 分 类 


1 .模拟 

用 一 种 模型 来 模仿 . 拟 合 (地 质 ) 现 象 或 再 现 ( 地 质 ) 过 程 , 称 为 模拟 。 

2. 模 拟 分 类 

模拟 有 不 同 的 分 类 方法 : 按 实现 的 途径 和 手段 ,可 分 为 物理 模拟 和 计算 机 (或 数学 ) 模 拟 ; 
按照 模拟 的 思路 不 同 ,可 分 为 确定 型 模拟 和 随机 型 模拟 (简称 随机 模拟 ) ;按照 是 否 有 时 间 因 素 
参 入 ,可 分 为 静态 模拟 和 动态 模拟 。 

1) 物 理 模 拟 和 计算 机 (或 数学 ) 模 拟 

物理 模拟 借助 于 物理 模拟 装置 模仿 , 拟 合 ( 地 质 ) 现 象 或 再 现 (地质 ) 过 程 ,物理 模拟 具有 时 
间 和 空间 (模型 大 小 ) 局 限 性 ,对 复杂 地 质 现象 或 过 程 的 模拟 ,只 能 给 出 一 些 参数 ,或 比较 适合 
对 (地 质 ) 现 象 或 (地 质 ) 过 程 进 行 机 理 研究 。 

计算 机 模拟 借助 于 计算 机 模仿 、 拟 合 (地 质 ) 现 象 或 再 现 (地 质 ) 过 程 ,从 理论 上 讲 , 可 以 模 
拟 的 时 间 段 和 空间 大 小 不 受 限 制 ,与 物理 模拟 相 比 ,有 很 大 的 优越 性 。 

2) 确 定型 模拟 和 随机 型 模拟 (简称 随机 模拟 ) 

确定 型 模拟 从 事物 的 本 质 出 发 ,在 获得 各 变量 变化 规律 及 变量 之 问 定量 或 半 定 量 关 系 的 
基础 上 ,构建 数学 模型 ,并 通过 模型 的 求解 ,来 再 现 地 质 过 程 。 

随机 型 模拟 从 观察 到 的 数据 (现象 ) 出 发 ,在 尊重 已 知 数据 的 情况 下 ,模拟 未 取样 点 变 基 所 
有 可 能 取 值 的 情况 ,以 分 析 变 量 的 变化 性 和 不 确定 性 。 

3) 静 态 模拟 和 动态 模拟 

静态 模拟 不 考虑 时 间 因 素 ,而 动态 模拟 考虑 时 间 因 素 。 

以 上 不 同 的 分 类 可 组 合 使 用 ,如 确定 型 动态 计算 机 模型 (盆地 模拟 ) .随机 型 静态 计算 机 模 
型 ( 油 藏 描述 ) 和 随机 型 动态 计算 机 模型 ( 油 藏 模拟 ) 等 。 

另外 ,同一 分 类 方案 中 不 同类 型 的 模拟 ,也 可 以 结合 起 来 使 用 ,如 物理 模拟 和 计算 机 模拟 
常常 结合 在 一 起 ,确定 型 模拟 和 随机 型 模拟 也 常常 结合 在 一 起 。 

3. 非 条 件 模拟 和 条 件 模拟 

非 条 件 模拟 ,只 再 现 变量 的 结构 特征 ,而 条 件 模拟 既 能 再 现 变量 的 结构 特征 ,又 能 在 样品 
点 上 使 模拟 值 等 于 真实 值 ,其 最 大 的 好 处 是 能 上 青 现 区 域 化 变量 真实 值 的 离散 性 和 波动 性 。 
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二 、Monte 一 Carlo 模拟 的 基本 原理 


Monte—Carlo 思想 是 Von Neuman 和 Ulam 在 研究 裂变 物质 的 中 子 随机 扩散 时 提出 的 , 它 利 
用 随机 数 进行 统计 试验 (相当 于 双 样 过 程 或 随机 试验 ), 以 求 得 统计 特征 值 作为 待 解 问题 的 数 
值 解 ,其 基本 步骤 如 下 所 述 。 

1. 随 机 数 概率 分 布 函数 F(z) th itt 

在 生成 随机 数 之 前 ,首先 ,要 确定 随机 数 的 概率 分 布 函数 F(z) 及 参数 ,这 种 分 布 类 型 可 能 
是 事先 知道 的 或 通过 实际 数据 拟 合 得 到 的 。 

2. 随 机 数列 的 生成 

1) 均 匀 随 机 数 的 生成 

产生 在 [0,1] 区 间 内 均匀 分 布 的 随机 数 r, , 见 图 7 - 1(a) ,均匀 随机 数 产生 方法 有 观测 法 、 
数学 方法 等 ,也 可 用 随机 数 生成 装置 来 生成 。 理 论 上 可 以 生成 无 穷 多 个 r 值 ,但 实际 操作 过 
程 中 , 选 一 个 足够 大 的 i 值 即 可 ,一 般 选 择 i = 100 ~ 200, 但 一 般 i 应 大 于 30, 以 保证 分 析 具 有 
统计 学 意义 。 
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图 7-1 [0,1] 之 间 均 匀 分 布 随机 数 r 的 生成 (a) 和 服从 概率 分 布 F(z) 的 随机 数 生成 (b) 
2) 服 从 概率 分 布 函数 F(z) 的 随机 数 的 生成 
把 [0,1] 区 间 均 匀 分 布 的 随机 数 r, 看 作 是 概率 分 布 函数 F(z) 的 概率 值 , 即 F(z,) = r, ,用 
反 变 换 z, = F-'(7;), 即 可 得 到 服从 分 布 函 数 F(z) 的 = , 见 图 7- 1(b)。 
3. 随 机 数 z, 的 统计 特征 分 析 
对 随机 数 z, 进行 统计 分 析 , 以 求 得 统计 特征 值 作为 待 解 问题 的 数值 解 。 


三 、 空 间 变 量 研究 中 随机 模拟 的 必要 性 和 意义 


克 立 金 估计 是 一 种 线性 无 偏 和 最 优 的 估计 ,具有 平滑 效应 ,不 能 真实 地 反映 变量 的 变化 
情况 ,平滑 效应 由 下 列 圆滑 关系 式 表示 (图 7- 2) 
D*(/G) = DŹ(W/G) + ch (1-1) 
上 式 中 的 DOCE v 为 承载 的 变量 在 C 域 中 的 离散 方差 (定义 离散 方差 为 方差 的 期 
望 值 ) ,D3(v/C) 为 克 立 金 估计 值 Z2 OE G 域 中 的 离散 方差 (图 7- 3)。 式 (7 - Dla? 
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为 各 单元 上 克 立 金 方差 之 平均 值 , 其 表达 式 为 
区 LS 94%) = LD EI) - 246017 (1-2) 


sa 正 是 因为 克 立 金 方法 的 平滑 效应 ,使 得 克 
立 金 估计 把 变量 的 变化 性 以 低 通 滤波 的 形式 滤 
掉 , 从 而 掩盖 或 不 能 很 好 地 再 现 变量 的 变化 性 ， 
PA 而 对 这 种 变化 性 的 认识 有 时 是 非常 重要 的 ,如 
在 油 藏 范围 内 ,一 个 高 孔 渗 通 道 对 开发 来 说 可 
能 很 重要 ,由 背景 区 过 滤 到 高 孔 渗 通 道 区 ,变量 
zw k 值 发 生 了 较 大 的 变化 , 克 立 金 方法 不 能 有 效 地 
| ma ~ ri 一 一 = 反映 这 种 变化 ,而 随机 模拟 给 出 的 模拟 图 形 , 能 


Di(v/G) 








反映 变量 的 这 种 变化 性 。 
图 7-2 克 立 金 估计 平滑 效应 示意 图 另 一 方面 ,由 随机 模拟 给 出 的 反映 变量 不 


确定 性 的 随机 图 形 , 输 入 到 其 它 模型 中 (如 黑 油 
模型 中 ) ,获得 研究 变量 或 称 输出 变量 (如 见 水 时 间 ) 的 概率 分 布 曲线 ,为 风险 决策 提供 科学 依 
据 ( 图 7-4)。 

















图 7-3 关于 离散 方差 的 示意 图 


(627) A 














图 7-4 随机 模拟 过 程 和 应 用 示意 图 


、\ 随 机 建 模 技术 在 油 藏 描述 中 的 应 用 情况 


随机 建 模 第 一 次 报道 是 在 1984 年 ,如 今 随机 建 模 技术 和 人 露头 分 析 、 高 分 辩 率 地 震 结合 共 
同 构成 了 储 层 研 究 中 的 新 技术 。 使 用 统计 概念 和 随机 性 概念 来 建立 地 质 模型 ,把 油 藏 工程 研 
究 提 高 到 了 一 个 新 的 水 平 ,建立 储 层 随机 地 质 模型 的 过 程 简称 为 储 层 的 随机 建 模 。 

早期 的 储 层 研 究 主要 利用 定性 或 半 定 量 的 确定 型 地 质 模型 , 称 为 储 层 描述 (Reservoir de- 
scription) 。 利 用 充分 的 地 质 资料 结合 现代 新 技术 对 储 层 分 布 的 复杂 性 ( 非 有 序 性 、 各 向 异性 、 
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非 连续 性 和 非 均 质 性 等 ) 进 行 定 量化 评价 , 称 为 储 层 表征 (Reservoir Characterization)o . 

由 于 获取 的 地 质 资料 和 信息 、 数 据 具有 分 散 性 、 稀 朴 性 、 跳 跃 性 ,间接 性 和 随机 性 ,利用 这 
些 资料 来 建立 模型 时 ,其 结果 必然 包含 有 不 确定 性 和 多 解 性 ,这 就 要 求 在 储 层 表征 中 引入 随机 
建 模 技术 。 

随机 建 模 用 于 研究 储 层 静态 行为 ,具体 包括 下 列 几 个 方面 :(1) 岩 相 的 划分 和 空间 分 布 ; 
(2) 沉 积 相 带 划分 和 空间 分 布 ;(3) 孔 ` 渗 、 饱 的 空间 分 布 ;(4) 砂 体 中 悬挂 着 的 泥岩 的 空间 分 布 
和 尺寸 ;(5) 储 层 中 遮挡 带 的 空间 分 布 ; (6) 不 同 砂 体 之 间 的 连通 性 ; (7) 储 层 的 空间 位 置 和 形 
状 ;(8) 断 层 和 裂缝 的 位 置 方向 及 其 空间 分 布 ;(9) 储 层 可 采油 气 的 空间 分 布 ;(10) 储 层 的 产量 
预报 ;(11) 油 田 开发 中 的 风险 评价 ;(12) 提 供 油田 开发 方案 。 


第 二 节 ”连续 变量 的 随机 模拟 


一 \ 估 计 值 加 模拟 误差 模拟 方法 


1. 基 本 原理 
BŁ Z2(x ) 为 区 域 化 变量 Z(x ) 在 x 点 处 的 克 立 金 估 计 值 ,通过 简单 变换 可 得 
Z(x) = Zi(x) + [Z(x) - Z4(x)] = Z4(x) + R(x) (7-3) 

根据 转换 带 法 等 ,可 以 得 到 区 域 化 变量 Z(x ) 的 非 条 件 模拟 Z, (x) ,由 此 可 读 出 在 样品 点 
x, 处 的 非 条 件 模拟 值 Z, (x) (a = 1,2,…,n) ,根据 Z, (x, )(e =1,2,…,n), 可 用 克 立 金 法 得 到 
估计 值 Z2(x)。 

由 于 Z,(x) 与 Z(x) 同 构 ( 即 两 者 具有 相同 的 数学 期 望 \ 相 同 的 分 布 直方 图 和 相同 的 C(h) 
或 Y(h)), 且 估计 构 形 相同 , 故 知 其 克 立 金 权 系数 à, 也 一 样 , 即 


Za(x) = DAZ), Za (a) = Na.2,(2,) 
i uj 


K Zu (x) 与 Z%(x) 是 同 构 的 ,显然 ,Z,(x) - Zala) ZC) - Z2(x) 也 是 同 构 的 。 
同时 ,由 于 Z(x) - Z2(x) 与 Z2(x) 独 立 , 故 非 条 件 模拟 Z, (x) - Z%(x) 也 与 Z2(x) 独 立 。 
用 一 个 与 未 知 克 立 金 误差 Z(x) - Z2(x) 同 构 且 独立 的 非 条 件 模拟 的 克 立 金 误 差 Z, (x) 
- Zm(x) 来 代替 未 知 的 克 立 金 误差 Z(x) - Z2(x) ,就 可 得 到 条 件 模拟 公式 
Z,(x) =Z2(xz)+[Z(x)- Zu(x)] 
(7-4) 
=Z,(x) + 2% I Z(x,) - Z,(x,)] 
可 以 证 明 式 (7- 4) 中 的 Z。 (4) 具 有 如 下 性 质 (具体 证 明 见 王仁 铎 等 ,1988) : 
(1)2.(x) 与 Z(x) 有 相同 的 期 望 值 ; 
(2)Z.(x) 与 Z(x) 有 相同 的 变 差 函 数 ; 
(3) 在 实测 点 上 Z.(x,) = Z(x,); 
(4)E[Z(x)- 2Z.(x)] =2c2。 
根据 以 上 性 质 ,利用 式 (7 - 4) 就 可 对 区 域 化 变量 Z(x) 进 行 条 件 模拟 。 
图 7- 5 为 估计 值 加 模拟 误差 模拟 方法 的 一 个 实例 。 
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1c) 非 条 件 模拟 
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图 7- 5 估计 值 加 模拟 误差 模拟 方法 实例 

图 7- 5(a) 为 实测 数据 ,作为 模拟 的 条 件 , 故 又 称 为 条 件数 据 ;图 7 - 5(b) 为 实测 数据 的 克 
立 金 插值 ,对 应 式 (7- 4) 中 的 Zi(x); 图 7-5(c) 是 根据 条 件数 据 [图 7- 5(a)] 实 现 的 非 条 件 
模拟 ,对 应 式 (7- 4) 中 的 Z,(x); 图 7-5(d) 是 非 条 件 模拟 数据 的 克 立 金 插值 ,对 应 式 (7 - 4) 中 
的 Zala) ET- 5(e) 为 模拟 误差 ,对 应 式 (7- 4) 中 的 [ Z, (x) - Za(x)] ;图 7- 5(f) 为 条 件 模 
拟 结果 ,对 应 式 (7- 4) 中 的 ZY (x) + lZ, (Ca) - Zz (a)1 0 
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二 、 序 贯 模拟 

1. 基 本 思路 

把 样品 点 的 数据 或 信息 称 为 条 件数 据 ,如 图 7 - 6 中 的 数据 即 为 条 件数 据 。 

在 模拟 时 ,对 研究 区 首先 进行 网 格 化 处 理 ,网 格 节点 为 待 模拟 的 点 (图 7 - 6)。 随 机 选取 
-网 格 节点 ,对 该 点 的 变量 值 进行 模拟 ,得 到 一 模拟 值 ,然后 ,在 模拟 以 后 各 点 的 变量 值 时 ,把 
先前 的 模拟 值 作为 条 件数 据 ,具体 步 又 如 下 : 

(1) 对 研究 区 进行 网 格 化 处 理 ; | Ki 

(2) 随 机 地 选取 一 个 网 格 节点 作为 模拟 点 ; P 

03) 估计 该 模拟 点 处 随机 变量 的 条 件 概率 分 | 
Ra * | 
随机 变量 的 概率 分 布 ; 

(4) 从 该 条 件 概率 分 布 中 随机 拾取 一 个 值 ， nl NIE "s i 
为 该 点 随机 变量 的 模拟 值 ; - 

(5) 把 (4) 中 获得 的 模拟 值 加 入 到 条 件数 据 中 ,| 5 
成 为 以 后 模拟 中 的 条 件数 据 ; 一 T 

(ORN ESRNENSIAMM HAEN] s| k 
模拟 值 。 和 

完成 以 上 步骤 ,得 到 一 由 随机 图 像 , 即 完成 了 2 "2 
-次 随机 模拟 。 NOZE g 

重复 以 上 6 个 步骤 ,可 以 得 到 另 一 幅 随 机 图 图 ?7- 6 随机 模拟 网 格 化 图 未 
像 ,如 此 进行 下 去 ,可 得 到 无 穷 多 幅 随 机 图 像 。 从 理论 上 来 讲 ,这 些 随 机 图 像 出 现 的 可 能 性 是 
完全 相等 的 。 

在 实际 模拟 中 ,- - 般 获 得 若干 幅 随机 图 像 , 通 过 对 这 些 随机 图 像 进 行 分 析 . 归 类 ,从 中 筛选 
出 具有 代表 性 的 儿 幅 随机 图 像 作为 模拟 的 结果 ,用 来 对 区 域 化 变量 的 不 确定 性 进行 表征 和 研 
究 。 

2. 序 贯 高 斯 模拟 

1) 序 贯 高 斯 模拟 过 程 

所 谓 序 贯 高 斯 模拟 ,是 假设 区 域 化 变量 服从 高 斯 ( 正 态 ) 分 布 ,从 而 在 模拟 点 处 随机 变量 的 
条 件 概率 分 布 为 一 正 态 分 布 ,其 期 望 值 为 该 点 的 克 立 金 估计 值 Z (x*), 其 方差 为 该 点 的 克 立 
金 估计 方差 o34(x), 序 贵 高 斯 模拟 的 具体 步骤 如 下 : 

(1) 对 研究 区 进行 网 格 化 处 理 ; 

(2) 随 机 地 选取 一 个 网 格 节点 作为 模拟 点 ; 

(3) 对 模拟 点 进行 克 立 金 估计 ,得 到 Z2 (x) 和 aż, (w) ,该 点 处 随机 变量 为 一 正 态 分 布 ,其 
期 望 值 为 Zaa) ENAH o (x), 见 图 7-7(e); 

(4) 从 该 点 正 态 分 布 变量 中 随机 拾取 一 个 值 ,作为 该 点 随机 变量 的 模拟 值 [图 7-7(d)]; 

(5) 把 (4) 中 获得 的 模拟 值 加 入 到 条 件数 据 中 ,成 为 以 后 模拟 中 的 条 件数 据 ; 

(6) 重 复 以 上 步 又 直至 得 到 所 有 网 格 节点 上 的 模拟 值 。 

完成 以 上 步 又 ,得 到 一 幅 随 机 图 像 , 即 完成 了 一 次 随机 模拟 。 
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图 7-7 序 贯 高 斯 模拟 


重复 以 上 6 个 步 又 ,可 以 得 到 另 一 幅 随机 图 像 , 如 此 进行 下 去 ,可 得 到 无 穷 多 幅 随机 图 
像 。 
2) 序 贯 高 斯 模拟 的 性 质 
(1) 再 造 一 元 变量 的 分 布 函数 odf (常常 以 直方 图 来 表示 ); 
(2) 在 样品 点 模拟 值 等 于 实测 值 ; 
(3) 再 造 协 方差 函数 C(h) 或 变 差 函 数 7(h) 。 
3. 序 贯 指示 模拟 
1) 方 法 的 原理 
两 个 随机 变量 Z(x) 和 Z(x +4) 之 间 的 空间 相关 性 可 由 二 维 联合 分 布 函 数 表征 
P{Z(x) < z,Z(z+h) <z }= Fh;z,z’) (7-5) 
在 区 域 化 变量 Z(x) 的 协 方差 函数 C(h) = EL Z(x)Z(x+h)] -LARCS -13)] 中 ， 
El Z(x)Z(x+h)] 项 可 以 表示 为 St 
ELZ) Zla + h)l = | | dF hss,) (1 - 6) 


故 协 方差 函数 C(h) 不 能 完全 表征 二 维 联合 分 布 函数 F(h;z,z')。 

序 贯 高 斯 模拟 只 能 再 现 Z(x) 的 协 方差 函数 C(h) 或 变 差 函 数 Y(h) ,不 一 定 能 够 保 让 识 
别 出 连 通 性 函数 P(A;z,z') ,与 高 斯 模型 有 关 的 模拟 具有 以 下 弱点 : 

(1) 不 能 完全 表征 二 维 分 布 函数 FC hz); 

(2) 缺 乏 灵活 性 ,不 能 再 造 指示 协 方差 函数 ; 

(3) 假 设 变量 服从 高 斯 分 布 ,统计 炉 最 大 , 即 平均 信息 量 最 大 ,无 序 性 最 强 , 故 不 能 识别 极 
值 连通 性 。 

因为 高 斯 模型 的 局 限 性 ,在 一 些 应 用 中 ,人 们 提出 改变 后 的 两 条 模拟 性 质 : 

(1) 再 造 二 维 联合 分 布 函数 F(h;z,2'); 

(2) 模 拟 值 可 再 现 协 方差 函数 
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由 此 ,产生 了 序 贯 指示 模拟 (SIS) ,该 方法 既 可 适用 于 连续 变量 ,又 可 适用 于 离散 变量 , 同 
时 ,适用 于 有 软 /模糊 数据 的 情况 。 

2) 实 施 步 又 

《1) 所 有 已 知 数据 (包括 软 数据 ) 的 指示 值 编码 , 见 式 (6- 35); 

(2)K 个 指示 协 方差 / 变 差 函 数 的 计算 , 见 式 (6 - 39) 和 (6- 40); 

《3) 在 模拟 网 格 中 的 每 个 节点 x, , 解 个 指示 克 立 金 方程 组 , 见 式 (6 - 46) , 求 出 x 点 处 随 
机 变量 ZC) A n 个 样品 点 数据 为 条 件 的 后 验 概率 分 布 函 数 


D(z) = PIZ(%) < zł(n)ł = Nazi) lx, sz) (k = 1,2," ,K) (7-1) 


GH A, (2,55,)(1= 1,2,…,n) 代 表 对 模拟 点 x, 进行 估计 的 指示 克 立 金 系数 ,1( x,; a) RER 
品 点 x, 处 变量 值 的 指示 编码 值 ; 

(4) 从 后 验 概率 分 布 函数 中 随机 抽取 一 模拟 值 z( x, ) ,并 把 该 模拟 值 加 到 条 件数 据 中 ; 

(5) 返 回 到 (3) 重 复 运算 ,直到 抽 过 所 有 的 N 个 模拟 节点 ,通过 求解 K x N 次 指示 克 立 金 
方程 组 ,可 得 到 一 个 实现 z( x,) (1 = 1,2,…,N) ,一 个 实现 给 出 一 幅 随机 图 像 。 

要 获得 M 个 实现 , 需要 进行 Kx N x M 次 指示 克 立 金 方 程 组 求解 。M 个 实现 给 出 内 幅 
不 同 的 随机 图 像 , 这 M 幅 不 同 的 随机 图 像 出 现 的 概率 是 相等 的 , M 幅 随 机 图 像 之 间 的 差异 反 
映 了 变量 的 空间 联合 不 确定 性 。 

说 明 : 由 于 指示 克 立 金 的 性 质 , 改 变 后 的 两 条 性 质 可 以 满足 ,推理 过 程 如 下 。 

考虑 指示 克 立 金 估计 

I (aiz) = Dilasa) (rsa) (7 - 8) 
对 应 的 简单 指示 克 立 金 方程 组 (以 指示 协 方差 函数 表示 ) 写 成 


Dana) Gla - s) = GCs - x) (i = 1,2,--,n) 


(7 - 9) 

Dalszy) = 1 

指示 克 立 金 估计 的 期 望 值 
ELU (xjza)} = BE{ DAs za) I(x.32)} = P(x) = F(xsz) (1 -= 10) 


满足 改变 后 的 第 一 条 性 质 ， 直方 图 将 被 模拟 值 重 现 。 

现在 来 看 指示 估计 D (x;z) 与 任何 一 个 指示 值 的 协 方差 函数 

ELUT" (xsx) - P,(x,)] TICs) — P,(x,)1) 

š EL STA Gs) ssn) =- EO) (ars) aa Dasa) - P,(x01) 
= Nala sz) ELIs) - PiU) - P(x)]} 


SDI (Gia) bi(4 IM EG (=) (1-11) 
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故 指示 克 立 金 估计 1 (x; a) 满足 所 有 的 指示 协 方差 函数 C, (x, - x,) ,改变 后 的 第 二 条 
性质 满足 。 

由 以 上 性 质 可 知 , 序 贯 指示 模拟 可 以 再 现 区 域 化 变量 的 连通 性 ,对 于 模拟 油气 藏 中 的 高 
(或 低 ) 孔 渗 带 具有 重要 作用 。 


三 ,区 域 化 变量 随机 模拟 的 特点 


1. 与 Monte 一 carlo 模拟 对 比 

区 域 化 变量 的 随机 模拟 借助 于 Monte 一 carlo 模拟 的 基本 思想 ,不 仅 能 再 现 区 域 化 变量 的 概率 分 
布 ,而 且 能 再 现 区 域 化 变量 的 空间 结构 性 特征 ,而 Monte 一 carlo 模拟 只 能 再 现 变量 的 概率 分 布 。 

2. 与 克 立 金 估计 对 比 

(1) 重 现 变 化 性 ,由 于 通过 模拟 可 求 出 与 Z(x) 一 样 的 协 方差 函数 或 变 差 函 数 ,从 而 可 重 
现 真 实 值 的 离散 方差 ; 

(2) 在 对 不 确定 性 的 估计 上 ,普通 克 立 金 估 计 给 出 一 个 估计 值 和 相应 的 估计 方差 ,一 次 给 
出 一 个 未 知 量 的 不 确定 性 估计 ,指示 克 立 金 用 后 验 条 件 分 布 来 估计 不 确定 性 ,而 随机 模拟 给 出 
联合 空间 分 布 的 估计 ,能 够 从 整体 上 对 未 取样 点 提供 一 种 不 确定 性 的 度量 ,而 不 是 局 部 地 ,一 
个 位 置 接着 一 个 位 置地 反映 这 种 不 确定 性 。 

空间 联合 分 布 能 给 出 一 串 值 Z(z% )(! = 1,2,…,N) 大 于 某 个 阔 值 (门槛 值 ) zx. 的 概率 ,如 
表示 一 个 断层 或 流体 流动 的 优势 通道 

Zlx,l = 1,2,**,N/(n)] = Piz(x,) > z,,l = 1,2,**,N/(n)) (1 - 12) 

因此 ,随机 模拟 在 油气 藏 开发 地 质 研究 中 有 着 广泛 的 应 用 。 

3. 随 机 模拟 更 好 体现 了 区 域 化 变量 的 基本 思想 

随机 模拟 更 好 地 体现 了 区 域 化 变量 的 基本 思想 , 即 空间 上 任何 一 点 都 对 应 一 个 随机 变量 ， 
随机 模拟 能 够 再 现 这 些 随机 变量 的 联合 分 布 。 

4. 模 拟 值 不 等 于 真实 值 

模拟 不 能 制造 信息 ,模拟 值 不 等 于 真实 值 ,但 模拟 能 根据 已 知 的 信息 给 出 变量 的 变化 性 和 
不 确定 性 方面 的 综合 评价 。 


第 三 节 离散 变量 的 随机 模拟 一 一 面向 对 象 的 模拟 


一 、 离 散 变 量 随机 模拟 的 原理 


前 面 ,我 们 介绍 了 连续 变量 随机 模拟 的 原理 ,但 在 实际 研究 中 ,可 能 会 遇 到 离散 变量 随机 
模拟 的 问题 ,如 沉积 微 相 类 型 . 岩 性 分 布 等 问题 ,这 类 变量 也 称 为 类 型 变量 或 属性 变量 ,这 就 需 
要 有 针对 这 类 变量 的 模拟 方法 。 

对 离散 变量 (类 型 变量 ) 进 行 模拟 时 ,我 们 把 类 型 变量 中 的 每 个 类 型 作为 一 个 整体 , 按 一 定 
的 规则 随机 地 模拟 每 个 类 型 的 空间 位 置 和 测度 (长 度 ,面积 或 体积 ), 所 以 ,这 类 模拟 方法 又 称 
为 面向 对 象 的 模拟 方法 。 

通过 随机 地 模拟 每 个 类 型 的 空间 分 布 和 测度 (长 度 \ 面 积 或 体积 ) ,最 终 使 各 类 型 的 分 布 和 
测度 达到 事先 确定 的 目标 , 即 可 得 到 模拟 图 像 ,该 图 像 即 为 离散 变量 的 一 个 随机 图 像 ,重复 模 
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拟 过 程 , 就 可 得 到 无 穷 多 个 随机 模拟 图 像 。 

离散 变量 的 随机 模拟 以 Boolean 过 程 为 基础 , Boolean 过 程 是 由 几何 体 在 空间 上 服从 于 某 
一 概率 分 布 而 产生 的 , 示 性 点 过 程 是 Boolean 过 程 的 扩展 和 推广 ,在 示 性 点 过 程 模拟 中 ,物体 中 
心 的 空间 分 布 构成 一 个 点 过 程 ,这 一 方法 不 适用 于 连续 变量 ,不 能 以 显 式 再 现 协 方差 或 变 差 本 
数 ,也 不 能 以 显 式 服从 已 知 数据 。 

同时 ,我 们 注意 到 ,第 六 章 中 的 指示 转换 采用 以 下 形式 也 可 对 离散 变量 进行 研究 

Ac 车 «点 处 变量 属 类 型 (6=1,2,=,n) 

A, 0 车 点 处 变量 类 型 不 局 类 型 -kk=1,2,…,K) 
式 中 ,n 为 样品 点 个 数 ; 为 离散 变量 类 型 个 数 。 

经 过 式 (7 - 13) 的 指示 值 编码 后 ,离散 变量 在 取样 点 就 转化 成 0 和 1, 用 前 面 的 序 贯 指示 模 
拟 方法 就 可 实现 对 该 离散 变量 的 模拟 ,得 到 的 模拟 图 像 即 为 离散 变量 的 个 类 型 在 空间 上 的 
分 布 情况 。 

在 具体 应 用 时 ,离散 变量 的 随机 模拟 又 可 以 和 连续 变量 的 随机 模拟 联合 使 用 , 即 先 对 类 型 
变量 (如 岩 性 类 型) 进行 模拟 ,然后 ,在 各 类 型 内 部 用 连续 变量 随机 模拟 方法 实现 某 一 参数 (如 
孔 院 度 ) 的 随机 模拟 ,这 就 是 所 谓 的 两 步 模拟 方法 ,该 方法 有 助 于 提高 参数 模拟 的 精度 。 

二 、Boolean 模拟 基本 步骤 一 一 以 井 间 砂 体 分 布 模拟 为 例 

现 以 井 间 砂 体 的 分 布 模拟 为 例 ,来 说 明 Boolean 模拟 的 基本 步骤 (图 7- 8). 


(7-13) 


A (a) 条 件数 据 (b) 服从 并 数据 
A 


A 随机 产生 的 砂 体 必须 与 并 中 的 砂 体 一 致 人 


六 = = f ai 
| 












(cH (d) 最 终 实现 
à 与 井中 砂 体 不 一 臻 的 随 A A 加 入 砂 体 直至 
A 机 砂 体 必须 去 除 或 移动 A A 砂 地 比 与 目标 值 一 致 A 























图 7-8 布尔 模拟 示意 图 

(1) 把 两 口 井 钻 遇 的 砂 体 分 布 信息 作为 条 件数 据 , 见 图 7- 8(a); 

(2) 假 定 砂 体 的 形态 为 向 下 凸 的 长 轴 半 透镜 体 ,随机 确定 其 位 置 和 尺寸 并 置 于 图 中 , 若 模 
拟 出 来 的 信息 与 条 件数 据 (两 口 井 的 信息 ) 不 矛盾 , 则 接受 该 模拟 , 见 图 7- 8(b); 

(3) 继 续 前 述 步 骤 , 若 模拟 出 来 的 信息 与 条 件数 据 ( 两 口 井 的 信息 ) 出 现 矛 盾 , 则 删除 该 模 
拟 , 见 图 7-8(e); 

(4) 重 复 以 上 步骤 至 一 事先 确定 的 目标 [如 砂 地 比 达 到 某 一 确定 值 ,图 7 -8(d)]。 
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第 四 节 ”退火 模拟 一 一 二 次 建 模 


一 基本 原理 


“退火 "一 词 源 自 于 热 动力 学 中 的 一 个 概念 , 液 ( 流 ) 体 凝固 和 结晶 或 金属 冷却 都 是 退火 过 
程 。 高 温 条 件 下 ,分 子 可 自由 移动 , 随 着 温度 逐渐 降低 ,分 子 组 合 在 一 起 形成 晶体 ,代表 系统 的 
最 低能 量 状态 。 温 度 降低 , 负 炳 增加 ,使 系统 更 有 序 。Boltzman 概率 分 布 表明 在 一 定 温度 下 处 
于 热平衡 态 的 系统 的 不 同 热 状态 E 出 现 的 概率 . 

P(E) ~ ekt (7 - 14) 

式 中 ,7 为 系统 的 温度 ; 尼 为 系统 的 热 状态 (或 称 能 量 状 态 ) ; K, 为 Boltzman 常数 。 

根据 式 (7- 14) 可 知 , 当 E 一 定时 ,7T 越 高 , P(E) 越 大 ,反之 亦 然 ;7 一 定时 ,E RK, P 
(E) 越 小 ,反之 亦 然 。 

RO - 14) 表 明 , 甚 至 在 低温 条 件 下 ,也 有 一 个 系统 处 于 高 能 量 状态 的 概率 ,只 不 过 概率 趋 
于 小 值 。 

退火 模拟 是 一 种 联合 优化 方法 ,其 实质 是 寻求 具有 大 量 元 素 的 系统 的 最 优 组 合 顺序 。 

退火 算法 中 的 基本 问题 包括 目标 函数 ,日 标 函数 调整 方法 干预 机 制 和 一 些 用 于 降低 温度 
或 减弱 控制 参数 的 一 些 经 验方 法 。 

二 、 基 本 过 程 

(1) 生 成 一 初始 图 形 ( 这 可 以 是 前 面 模拟 的 结果 或 图 形 ); 

(2) 建 立 初始 控制 参数 Co 以 及 循环 过 程 中 降低 参数 C 的 “时 间 表 "(模拟 退 火 进程 Anneal- 
ing schedule) ,初始 控制 参数 的 大 小 可 以 等 于 初始 目标 函数 的 大 小 ; 

(3) 干 扰 图 形 , 如 调换 任意 两 个 节点 处 的 数值 ; 

(4) 计 算 一 个 新 的 目标 函数 Ono ,如 目标 函数 可 以 是 图 形变 差 函 数 和 目 你 变 差 函 数 之 差 的 
平方 和 

Y.(h) - rm(h))? 








"2" „0 (7 - 15) 
式 中 ,y,(h) 为 图 形 的 变 差 函数 ;7,(h) 为 目标 变 差 函 数 。 
(5) 建 立 接受 概率 分 布 
1 车 Ow < Ou 
P{ 接 受 } = 7- 
接受 (ou -2a 其 他 (7 - 16) 


(6) 根 据 此 概率 分 布 函数 做 出 决定 是 否 接受 干扰 ,若干 扰 被 接受 ,调整 图 像 和 目标 函数 使 
Ou = On; 
(7) 回 到 3, 循 环 运算 直到 目标 函数 足够 小 ,或 在 很 多 循环 计算 中 目标 函数 无 明显 变化 。 
控制 参数 C 不 能 降低 得 太 快 ,否则 图 形 就 不 会 收敛 ;车 控制 参数 C 或 温度 降低 得 太 慢 , 则 
运算 时 间 太 长 。 
图 7- 9 为 退火 模拟 的 一 个 实例 ,图 7- 9(a) 为 诛 始 图 形 ,图 中 的 网 格 大 小 为 20m x 3m, 黑 
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色 代表 砂 体 ,原始 图 形 的 实际 砂 地 比 为 .7% ,实际 砂 体 平均 长 度 为 29.78m, 平 均 厚 度 为 
4.53m。 要 求 用 退火 模拟 方法 调整 原始 图 形 , 其 目标 是 最 终 使 图 形 的 砂 地 比 为 70% , 砂 体 平 均 
长 度 为 60m, 平 均 厚度 为 10m; 图 7- 9(b) 为 第 1 次 迭代 ,随机 地 选取 两 个 网 格 (2,17) 和 (25， 
25) ,交换 两 个 网 格 中 的 “内 容 " ,获得 新 的 图 形 , 计 算 图 形 的 砂 地 比 为 69.7% , 砂 体 平 均 长 度 为 
30m, 平 均 厚度 为 4.57m, 该 图 形 向 目标 靠近 ,结果 改善 ,保存 图 形 并 进入 下 一 步 迭 代 ; 图 7-9 
(ce) 为 第 2 次 迭代 ,随机 地 选取 两 个 网 格 (2,13) 和 (23,5) ,交换 两 个 网 格 中 的 “内 容 " ,获得 新 的 
图 形 ,计算 图 形 的 砂 地 比 为 69.7% , 砂 体 平均 长 度 为 29.34m, 平 均 厚度 为 4.45m, 该 图 形 远离 
目标 ,结果 变 差 , 取 消 该 迭代 并 回 到 上 一 步 迭 代 ; 图 7-9(d) 和 图 7-9(e) 分 别 为 第 463 和 464 
次 迭代 ,和 迭代 一 直 进行 下 去 ,直到 获得 的 图 形 参数 与 目标 参数 一 致 , 见 图 7 - 9(f) , 即 完成 一 次 
退火 模拟 。 该 过 程 可 无 限 重 复 , 得 到 无 穷 多 个 退火 模拟 图 形 ,这 些 图 形 是 等 可 能 出 现 的 。 





(a) 原始 图 形 
第 个 网 格 为 ， 20mx3m 


实际 “日 标 

Witte: 69.7% 70% 
平均 长 度 ， 30.00m 60m 
平均 厚度 ，457m 10m 












kz 
RE = 
一 
(第 2 次 先 代 实际 目标 
(2.13)= 一 (23.15) 砂 地 比 :69.7% 70% 
DIETĄ 平均 长 度 ，45 68m 60m 
返回 上 一 图 形 平均 厚度 ，6.5sm 10m 
-本 my be 
E m 
| =. =: 
u 2 SE— ah a EM 
st ima" mJ. m 
— — — m 
(e) 第 464 次 近代 1f) 第 1987 次 适 代 实际 目标 
(2,5)—(8,22) (25.14) —(14.12) Wit: 607% 70% 
HRE 结果 改善 FEKI: 60.00m 60m 
返回 上 一 图 形 平均 厚度 : 65Im 10m 保存 图 形 平均 厚度 ， 988m 10m 
图 7-9 退火 模拟 实例 
44 ró ai żę r 
第 五 节 ”随机 模拟 应 用 实例 分 析 
一 \ 地 质 概况 


我 国 东部 某 油田 下 第 三 系 沙 河 街 组 的 沙 三 段 是 油田 的 主要 含油 层 系 ,整个 沉积 环境 为 扇 

三 角 洲 的 沉积 体系 ,沉积 物 近 源 快 速 堆积 ,分 选 差 , 储 层 岩 性 为 含 砾 砂岩 、 粗 砂岩 、 细 砂岩 等 岩 

性 ,横向 变化 快 。 储 层 受 沉积 条 件 ,构造 和 成 岩 作用 的 影响 , 非 均 质 性 很 强 , 孔 隙 度 分 布 范围 为 
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10% ~ 29% ,渗透 率 分 布 范围 (30 ~ 290) x 107° pm” , 储 层 的 非 均 质 性 严重 影响 了 开发 效果 。 因 
此 准确 预测 储 层 参 数 的 井 间 变 化 ,揭示 储 层 的 宏观 非 均 质 性 ,对 于 分 析 油田 剩余 油分 布 规律 、 
提高 油田 开发 效果 具有 十 分 重要 的 地 质 意 义 ,随机 建 模 正 是 实现 上 述 目的 的 有 效 方法 。 

在 储 层 随 机 建 模 中 ,首先 要 取得 有 关 储 层 参 数 在 一 定 范围 内 的 变化 和 可 人 靠 数 据 ,目前 这 些 
数据 主要 包括 钻井 资料 , 测 井 资料 、 岩 心 分 析 资 料 以 及 生产 动态 资料 等 。 油田 现 有 各 类 钻井 
4 和 0 余 口 ,应 用 测 井 资料 ,通过 二 次 数字 处 理 , 可 以 得 到 井 点 处 储 层 的 参数 。 把 井 点 处 储 层 参 数 
作为 控制 点 ,通过 实验 变 差 函数 的 计算 ,选用 相应 的 理论 模型 进行 变 差 函 数 的 拟 合 ;然后 优选 
模拟 算法 对 井 间 储 层 参 数 进行 计算 ,得 到 储 层 参 数 的 三 维 数据 体 ,从 而 建立 起 储 层 参 数 的 三 维 
模型 。 下 面 以 该 油田 储 层 孔 辽 度 的 模拟 说 明 随 机 建 模 的 过 程 及 实现 。 


二 、 建 模 过 程 


1. 数 据 准备 

主要 包括 井 位 坐标 、 地 质 分 层 , 测 井 解 释 的 孔隙 度 和 作为 控制 条 件 的 沉积 相 、 地 质 分 层 、 断 
层 等 数据 。 

2. 孔 隙 度 的 统计 分 析 

图 7- 10 和 图 7- 11 分 别 为 工区 孔隙 度 概率 分 布 图 和 累积 概率 分 布 图 。 从 图 中 可 以 看 
出 ,孔隙 度 的 分 布 范围 是 0% ~ 30% ,优势 分 布 范围 是 10% ~ 20% ,并 且 和 孔隙 度 的 分 布 基本 符 


合 正 态 分 布 。 











0 5 10 15 2 2 30 5 10 15 
PRO PRO 





图 7- 10 和 孔隙 度 概率 分 布 图 图 7- 11 和 孔隙 度 累积 概率 分 布 


3. 实 验 变 差 函 数 的 计算 及 理论 变 差 函 数 模型 的 拟 合 
在 数据 统计 分 析 的 基础 上 ,可 以 计算 任意 两 口 井 之 间 孔 阶 度 的 实验 变 差 函 数 , 然 后 应 用 理 
论 变 差 函 数 模型 进行 拟 合 ,得 到 变 差 函数 模型 。 图 7 - 12 为 工区 孔隙 度 垂直 方向 实验 变 差 函 
数 的 计算 结果 和 应 用 球状 模型 进行 拟 合 得 到 的 变 差 函 数 模型 。 从 模型 中 可 以 看 出 , 变 差 函 数 
的 变 程 为 23m, 基 人 台 值 19, 块 金 常数 为 0, 于 是 该 模型 的 表达 式 为 
+ 144 - 











0 50 100 ~ 150 200 250 ~ 300 
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- 算 各 个 方向 的 变 差 函数 ,以 便 对 不 同方 向 孔隙 度 变化 的 变 差 函数 进行 结构 分 
差 函 数 的 套 合 结构 ,为 孔隙 度 的 井 间 预 测 提供 基础 

4. 优 选 相应 的 模拟 方法 进行 计算 ,实现 孔隙 度 的 井 间 预 测 

由 Fi Rai 资料 二 次 数值 处 理 的 精度 较 高 ,认为 井 点 处 孔隙 度 值 是 可 靠 的 ,要 求 模拟 结果 
- 井 点 数据 ,因此 选用 条 件 模拟 的 方法 。 为 了 尽量 利用 已 知 信息 和 提高 模拟 精 有 
模拟 的 方法 进行 迭代 计算 。 在 实际 模拟 过 程 中 ,针对 孔隙 度 的 变化 情况 ,在 各 种 方法 实 
的 基础 上 , 应 用 序 贯 高 斯 模拟 的 方法 进行 孔隙 度 的 计算 效果 较 好 , 网 格 的 几何 尺寸 为 
50x50x0.25m, 模 拟 的 结果 为 孔隙 度 三 维 数据 体 ,可 以 沿 任意 方向 进行 切片 ,以 研究 孔隙 度 的 
变化 规律 。 图 7 - 13 和 图 7 - 14 分 别 为 孔 辽 度 随 机 模拟 的 剖面 和 平面 图 ,从 图 中 可 以 直观 地 
观察 到 孔隙 度 在 空间 的 变化 
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图 7- 13 孔隙 度 随 机 模拟 乖 直 剖面 图 
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图 7- 14 和 孔隙 度 随机 模拟 水 平 切片 等 值 线 图 


令 思 考 和 练习 题 令 


1. 随机 模拟 有 何 作用 ? 

2. 随机 模拟 和 普通 克 立 金 、 指 示 克 立 金 有 何不 同 ? 
3. 简 述 序 贯 模拟 的 基本 步 又 。 

4. 序 贯 高 斯 模拟 与 序 贯 指示 模拟 的 区 别 是 什么 ? 
5. 随机 模拟 有 哪些 特点 ? 

6. 简 述 退火 模拟 的 基本 原理 。 
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第 八 章 “ 非 线性 科学 和 分 形 几何 及 其 应 用 


本 章 学 习 目 的 和 要 求 : 了 解 非 线性 科学 的 基本 思维 观 ,掌握 分 形 理论 的 基本 概念 
和 方法 原理 ,针对 不 同类 型 分 形体 ,掌握 其 分 形 维 数 的 各 种 计算 方法 。 了 解 分 形 理论 
在 油气 勘探 开发 中 的 应 用 范围 和 解决 问题 的 能 力 ,掌握 统计 分 形 在 实际 问题 中 的 多 
种 表现 形式 。 


第 一 节 ” 非 线性 科学 的 认识 论 


从 老 三 论 SCI( 贝 塔 朗 菲 的 一 般 系统 论 \ 维 纳 的 控制 论 和 申 农 的 信息 论 ) 到 新 三 论 DSC( 普 
里 高 津 的 耗 散 结构 论 , 哈 肯 的 协同 论 和 托 姆 的 突变 论 ) 是 20 世纪 科学 发 展 史 上 的 重大 革命 。 
耗 散 结构 理论 .协同 论 .突变 理论 ,混沌 动力 学 ,分 形 理论 几乎 都 是 创立 于 50 年 代 , 它 们 无 一 不 
是 跨 学 科 的 ,也 无 一 不 是 非 线性 的 ,它们 的 共同 目标 是 探索 大 自然 中 的 复杂 性 ,它们 从 不 同 的 
角度 揭示 出 复杂 现象 中 的 规律 性 。 这 些 非 线性 理论 在 20 世纪 是 继 量 子 力学 和 相对 论 两 次 重 
大 科学 发 现 后 的 第 三 次 科学 革命 。 非 线性 科学 正在 改变 人 们 对 世界 的 看 法 ,形成 了 一 种 新 的 
自然 观 ,促进 一 大 类 新 兴学 科 的 孕育 和 发 展 , 并 从 根本 上 影响 着 现代 科学 的 逻辑 体系 。 

天 体 演化 地 球 变迁 ,生命 起 源 ,都 涉及 由 大 量 粒子 组 成 的 复杂 系统 的 演变 规律 。 无 论 是 
宇宙 还 是 生命 ,物质 世界 都 经 历 着 从 无 组 织 的 混乱 状态 向 不 同 程度 有 组 织 状态 的 演变 ,实现 着 
从 “无 序 "到 “有 序 ”、 从 “简单 "到 “复杂 "的 各 种 过 程 ,如 何 从 总 体 上 认识 自然 界 发 生 的 这 些 复杂 
现象 , 找 出 其 基本 规律 ,就 构成 了 正在 兴起 的 跨 学 科研 究 领域 一 一 非 线性 科学 的 基本 内 容 。 

地 球 系统 是 地 球 科学 的 研究 对 象 , 它 是 一 个 复杂 的 巨 系 统 , 非 平衡 性 、 非 线性 ,多 尺度 性 、 
突变 性 、 自 组 织 性 、 自 相似 性 有 序 性 和 随机 性 等 是 其 最 本 质 的 属性 ,因而 非 线性 理论 及 有 关 方 
法 是 研究 地 球 科学 和 地 质 学 的 最 有 效 的 理论 和 方法 之 一 。 

一 、 系 统 及 其 分 类 


1 .系统 、 线 性 与 非 线 性 

1) 系 统 

系统 是 由 相互 作用 和 相互 依赖 的 若干 组 成 部 分 结合 而 成 的 具有 特定 功能 的 整体 (钱学森 ， 
1978)。 系 统 具 有 多 种 属性 ,由 此 决定 了 系统 的 多 种 类 型 。 系 统 有 严格 的 等 级 和 层次 之 分 。 美 
籍 匈牙利 学 者 欧文 ' 拉 兹 洛 是 继 贝 塔 朗 非 之 后 在 美国 推动 “系统 运动 "的 著名 系统 哲学 家 ,他 用 
有 序 整 体 (a) 、 自 稳定 (8) . 自 组 织 (y) 和 等 级 性 (8)4 个 基本 构成 因素 ,建立 了 “基本 系统 "的 普 
遍 模 型 , 即 


R = f(a,B,7Y,6) (8 - 1) 
2) 线 性 系统 
线性 系统 具有 又 加 性 , 即 当 z 为 系统 在 输入 为 x 时 的 输出 , 则 有 

ax +b = az+b (8 - 2) 
3) 非 线性 系统 


非 线性 系统 具有 相干 性 , 即 当 z 为 系统 在 输入 为 x 时 的 输出 , 则 有 
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ax + b 4 az +b (8 - 3) 

在 非 线 性 的 世界 里 ,随机 性 和 复杂 性 是 其 主要 特征 ,但 同时 ,在 这 些 极为 复杂 的 现象 背后 ， 
存在 着 某 种 规律 性 。 严 格 地 说 ,自然 界 的 系统 皆 为 非 线性 系统 ,但 有 的 非 线性 系统 可 用 线性 系 

2. 系 统 分 类 

按 系统 与 环境 的 关系 ,系统 可 分 为 孤立 系统 ,封闭 系统 和 开放 系统 。 

1) 孤 立 系统 

与 外 界 既 没有 物质 交换 ,也 没有 能 量 交 换 ( 如 将 中 性 气体 放 在 绝热 性 很 好 的 、 固 定 的 弹性 
壁 做 成 的 匣子 内 ,不计 重 力 )。 当 外 界 与 系统 的 相互 作用 对 所 研究 的 问题 影响 很 小 时 ,可 看 成 
孤立 系统 。 

2) 封 闭 系统 

与 外 界 没 有 物质 交换 ,只 有 能 量 交 换 的 系统 称 为 封闭 系统 ,如 在 忽略 陨石 和 字 宙 尘埃 的 条 
件 下 ,地 球 系统 可 近似 地 看 作 封 闭 系统 。 

3) 开 放 系 统 

与 外 界 既 有 物质 交换 ,又 有 能 量 交 换 的 系统 称 为 开放 系统 。 

另外 , 按 系 统 与 时 间 的 关系 ,系统 可 分 为 静态 系统 和 动态 系统 。 

3. 系 统 演化 的 方向 

孤立 系统 演化 的 惟一 方向 是 平衡 态 。 平 衡 态 是 在 没有 外 界 影响 下 ,系统 内 各 部 分 长 时 间 
不 发 生 任何 变化 的 状态 。 平 衡 态 不 存 任何 流 和 梯度 ,是 最 均匀 最 无 序 的 状态 ,也 是 一 个 没有 结 
构 的 状态 。 

封闭 系统 和 开放 系统 的 演化 方向 是 非 平衡 定 态 , 非 平衡 定 态 存在 着 稳 恒 的 流 和 梯度 。 

平衡 态 是 定 态 的 一 种 特殊 情况 ,平衡 态 不 存在 任何 流 和 梯度 ,如 烧 热 的 铁 棒 退 火 后 所 呈现 
的 状态 。 

4.Benard 对 流 实验 ( 热 驱动 ) 的 启示 

Benard 对 流 实 验 是 法 国 物 理学 家 Benard 于 1890 年 完成 的 ,实验 在 上 下 两 个 恒温 的 导热 板 
之 间 充 满 液体 (图 8 - 1) ,两 板 之 间 的 距离 H 远 小 于 板 的 宽度 和 长 度 , 上 下 板 的 温度 分 别 用 7， 
和 T, 表示 ,观察 在 不 同 的 温度 差 AT 的 情况 下 ,两 板 之 间 液 体 的 对 流 情况 。 


U A 


„LL SSE 





Ty = 





i 图 8- 1 Benard 对 流 实验 
实验 观察 结果 表明 : 


ODAT =0 时 ,液体 处 于 无 序 的 平衡 态 ; 
(DAT 不 超过 某 一 阔 值 7. 时 ,液体 在 宏观 上 以 静止 的 热传导 方式 传递 热量 ,如 图 8 - 1(a) 
BÓR; 
(3) 当 ATS 74 时 ,出 现 宏观 对 流 态 稳定 的 对 流花 样 ,如 图 8 — 1(b) 所 示 , 该 图 形 的 基本 组 
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成 单元 是 以 相反 方向 旋转 的 两 个 流体 “ 卷 ”; 

(4) 当 AT> To 时, 出现 随时 间 周 期 变化 的 对 流花 样 ; 

(5) AT > Te 时 ,出 现 混沌 状态 。 

二 ,混沌 

1. 混 沌 现象 的 发 现 

混沌 现象 是 气象 学 家 Lorenz 1963 年 发 现 的 ,他 为 了 预报 天 气 变化 ,把 大 气动 力学 方程 简 
化 为 12 个 方程 用 计算 机 做 数值 模拟 ,结果 发 现在 相同 的 初始 条 件 下 ,重复 模拟 结果 会 随 计算 
时 间 的 增加 而 彼此 分 开 ,最 后 变 得 毫 无 相似 之 处 。Lorenz 用 截 谱 方法 把 大 气动 力学 方程 进 一 
步 简化 为 3 个 一 阶 的 常 微分 方程 组 来 研究 热 对 流 问 题 , 在 一 定 的 参数 范围 内 得 到 了 同样 的 结 
论 ,并 在 三 维 相 空间 中 观察 到 混沌 行为 。 

2. 混 沌 定义 

混沌 是 在 确定 性 系统 中 出 现 的 随机 性 态 , 是 完全 由 定律 支配 的 无 定律 状态 。 一 般 认 为 , 确 
定性 系统 的 长 时 间 行为 ,可 能 对 初 值 的 微小 变化 极其 敏感 ,这 一 现象 称 为 混沌 。 由 于 混沌 ,最 
初 有 序 的 动态 系统 和 非 线性 系统 经 过 一 段 时间 可 转变 成 完全 无 组 织 的 状态 (图 8 - 2) ,还 有 另 
外 一 种 反 直觉 的 现象 称 为 反 混沌 , 某 些 非常 无 序 的 系统 自发 地 “结晶 "成 为 高 度 有 序 。 
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图 8-2 混沌 现象 
3. 混 沌 是 确定 论 与 随机 论 的 统一 
人 类 对 自然 现象 的 认识 存在 两 种 范式 : 


(1) 确定 论 :借助 微分 方程 的 高 精度 分 析 , 它 在 原理 上 确定 宇宙 的 整个 演化 ,而 实际 上 只 
适用 于 比较 简单 .结构 良好 的 问题 ,确定 论 用 于 自由 度 少 的 简单 系统 ; 

(2) 平 均 量 的 统计 分 析 , 它 刻画 高 度 复杂 系统 运动 的 粗糙 特征 ,统计 学 则 用 于 自由 度 多 的 
复杂 系统 。 

在 非 线性 科学 看 来 ,秩序 不 再 是 定律 的 同 义 语 ,无 秩序 不 再 是 无 规律 性 的 同 义 语 ,一 种 规 
律 属 于 有 秩序 性 态 ,而 另 一 种 属于 无 秩序 性 态 , 两 个 范式 两 种 方法 、 两 种 观察 世界 的 方式 、 两 
种 数学 思想 体系 ,各 自在 它 自己 的 势力 范围 内 适用 。 
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一 个 确定 性 系统 可 产生 随机 性 态 , 一 个 随机 现象 背后 可 能 有 确定 性 定律 支配 ,混沌 理论 把 
二 者 有 机 地 统一 起 来 。 

一 一 把 注 流 考虑 成 这 样 的 数学 对 象 : 一 个 或 几 个 奇异 吸引 子 也 称 怪 引 子 , 它 是 流体 系统 的 
非常 高 维 数 的 相 空间 中 较 小 维 数 的 流 形 ,在 此 怪 引子 上 的 运动 ,对 初 值 十 分 敏感 ,所 以 流体 运 
动 呈现 出 非 周期 的 似 随 机 特征 。 这 样 看 来 ,表面 上 漫 无 规则 的 运动 是 服从 严格 的 物理 定律 的 ， 
是 流体 方程 的 解 。 

一 一 在 热 或 流体 中 ,虽然 系统 的 每 个 分 子 都 遵循 牛顿 力学 ,这 是 确定 性 的 ,但 由 系统 的 微 
观 态 到 宏观 态 出 现 了 不 确定 性 ,一 个 平衡 态 对 应 许多 微观 态 , 这 种 一 对 多 的 对 应 关系 就 导致 了 
不 确定 性 ,我 们 不 知道 系统 到 底 处 于 哪个 确切 的 微观 态 ,而 只 知道 系统 处 在 每 个 微观 态 的 几率 
是 多 大 。 对 于 孤立 系统 ,众多 不 同 的 非 平衡 态 最 终 都 要 归于 一 个 平衡 态 ,这 又 是 一 对 多 的 对 应 
关系 ,从 最 终 的 平衡 态 无 法 判断 系统 来 自 于 哪个 非 平衡 态 ,这 就 是 普 里 高 津 (Prigogine) 所 认为 
的 ,未 来 并 不 完全 包含 在 过 去 之 中 。 

4. 混 沌 不 是 简单 的 无 序 和 混乱 ,而 是 某 种 不 规则 性 ,更 像 是 没有 周期 性 的 次 序 

混沌 更 像 是 没有 周期 性 的 次 序 ,在 理想 模型 中 , 它 可 能 包含 着 无 穷 的 内 在 层次 ,层次 之 间 
存在 着 “ 自 相似 性 "或 “不 尽 相 似 "。 在 观察 手段 的 分 辩 率 不 高 时 ,只 能 看 到 某 一 个 层次 的 结构 ， 
提高 分 辩 率 后 ,在 原来 不 能 识别 之 处 又 会 出 现 更 小 尺度 上 的 结构 。 完 全 的 决定 论 和 纯粹 的 概 
率 论 ,都 隐 含 着 承认 以 某 种 "无 穷 "过 程 为 前 提 。 然 而 ,只 要 承认 有 限 性 ,那么 决定 性 和 概率 性 
描述 之 间 的 鸿沟 就 消失 了 ,决定 论 的 动力 学 可 以 产生 随机 性 的 演化 过 程 。 

总 的 来 说 ,混沌 的 产生 经 历 了 一 个 从 无 序 到 有 序 , 又 从 有 序 到 无 序 的 进程 (如 Benard 对 流 
实验 ) ,然而 混沌 不 是 简单 的 巨 序 , 它 和 平衡 态 的 无 序 有 本 质 差别 ,在 混沌 无 序 中 还 包含 着 有 
序 ,是 一 种 有 结构 的 无 序 。 

三 、 耗 散 结构 一 一 系统 演化 的 热力 学 机 制 


1.2 ETAP Jh deh R 

DZK FERA 

(1) 热 力学 第 一 定律 。 

热力 学 第 一 定律 就 是 能 量 守恒 和 转化 定律 。 它 是 在 总 结 了 大 量 实验 工作 的 基础 上 得 出 来 
的 ,也 是 自然 界 最 普遍 的 规律 之 一 。 当 系统 的 状态 发 生变 化 时 ,系统 的 能 其 也 随 之 发 生变 化 ， 
这 种 能 量变 化 的 数量 关系 由 热力 学 第 一 定律 支配 。 

系统 的 状态 是 由 状态 参量 定义 的 。 由 状态 参量 完全 确定 的 函数 称 为 状态 函数 。 状 态 函 数 
的 一 个 重要 性 质 是 : 当 系统 由 一 个 状态 变 为 另 一 个 状态 时 ,状态 函数 的 变化 只 取决 于 这 种 变化 
的 初 态 和 终 态 。 系 统 的 内 能 就 是 这 样 一 种 状态 函数 。 所 谓 内 能 ,是 指 系统 内 粒子 的 热 运 动能 
量 和 粒子 间 相 互 作用 能 量 的 总 和 。 

如 对 于 “个 封闭 系统 ,其 内 能 的 改变 是 通过 系统 对 外 界 作 功 或 系统 和 外 界 交换 热量 来 实 
现 的 ,但 只 要 过 程 的 初 态 和 终 态 确定 ,系统 内 能 的 变化 便 完全 确定 ,与 作 功 和 热 交 换 的 方式 无 
关 。 相 反 , 即 使 过 程 的 初 态 和 终 态 确定 ,系统 对 外 界 作 功 或 系统 和 外 界 交换 热量 都 没有 确定 的 
值 ,因为 ,它们 取决 于 同 外 界 的 作用 方式 ,而 不 是 单独 由 状态 参量 所 能 确定 的 。 然 而 只 要 过 程 
的 初 态 和 终 态 确定 ,系统 对 外 界 作 功 和 系统 与 外 界 交换 热量 的 总 和 却 是 确定 的 值 , 它 正好 等 十 
系统 内 能 的 变化 , 即 








AE=Q-W (8 - 4) 
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式 中 ,AE 为 系统 初 态 到 终 态 的 内 能 增 量 ; Q 为 外 界 传递 给 系统 的 热量 ; W 为 系统 对 外 界 作 的 功 。 

(2) 热 力学 第 二 定律 。 

任何 不 可 逆 过 程 都 是 沿 着 单 向 进行 的 ,人 们 把 各 种 不 可 逆 过 程 表现 出 的 单 向 变化 的 共同 
规律 总 结 归纳 为 热力 学 第 二 定律 , 按 Clausius 的 说 法 ,不 可 能 把 热 从 低温 物体 传 到 高 温 物 体 而 
不 产生 其 它 影响 。 

GRANE. 

热传导 具有 不 可 逆 性 ( 单 向 性 ) ,那么 过 程 的 初 态 和 终 态 就 存在 着 相互 关系 , 即 不 可 能 用 任 
何 办 法 使 终 态 恢复 到 初 态 而 不 产生 其 它 变化 。 这 样 ,如 果 找 到 一 定 适当 的 态 函数 ,就 有 可 能 描 
述 不 可 逆 过 程 的 单 向 性 。 这 个 态 函 数 首先 由 Clausius 找到 „PRZY „JJ S 表示 。 

炳 是 系统 的 分 子 热 运 动 所 引起 的 无 序 性 的 一 种 度量 。 无 序 是 和 大 量 的 各 种 不 同 可 能 性 联 
系 在 一 起 的 。 在 无 外 界 影响 的 情况 下 ,不 可 逆 过 程 总 是 沿 着 从 非 均 匀 态 向 均匀 态 使 箭 增 加 的 
单一 方向 进行 的 。 系 统 宏观 状态 的 均匀 程度 在 微观 上 反映 了 分 子 运动 的 杂乱 程度 , 即 反映 了 
分 子 运动 方式 的 可 能 性 多 少 。 系 统 的 宏观 状态 越 均匀 , 它 的 分 子 微观 热 运 动 越 混乱 ,这 种 热 运 
动 的 混乱 程度 代表 着 系统 状态 的 无 序 程度 。 由 此 可 见 ,系统 的 非 均 匀 宏 观 态 的 无 序 程度 较 低 ， 
对 应 的 炉 值 也 较 小 ,而 均匀 宏观 态 的 无 序 程度 最 大 ,对 应 的 人 值 也 最 大 。 这 种 关系 首先 由 Bo- 
ltzmann 提出 , 称 为 Boltzmann 原理 ,其 表达 式 为 

S = K,lnW (8 - 5) 
式 中 ,K, X Boltzmann 常数 ,其 值 为 1.38 x10 PJK; W 为 系统 宏观 状态 的 热力 学 几率 (系统 
宏观 状态 的 热力 学 几率 , 指 系统 在 任 一 宏观 状态 所 对 应 的 微观 状态 数 ) 。 

对 于 只 有 热 接触 的 封闭 系统 ,一 个 微 过 程 的 炉 变 dS 满足 Clausius 不 等 式 


ds > $ (8 - 6) 


式 中 ,0 为 外 界 传递 给 系统 的 热量 ; 7 是 系统 吸收 外 界 热量 时 的 温度 。 

式 (8 - 6) 中 的 等 号 对 可 逆 过 程 成 立 , 不 等 号 对 不 可 逆 过 程 成 立 。 需 要 注意 的 是 ,可逆 系 
统 "只 具有 数学 上 的 意义 ,是 系统 演化 的 一 种 极限 状态 ,在 系统 处 于 平衡 态 的 时 候 , 我 们 才 可 以 
说 系统 是 可 逆 系 统 , 自然界 的 系统 皆 为 不 可 逆 系 统 。 

对 于 孤立 系统 ,系统 与 外 界 无 热量 交换 , 即 dQ = 0, 式 (8 - 6) 变 为 

ds > 0 (8 - 7) 

TRIKI RACE FABLE R ERK SEBUM. EREEREER 
PARLE, EC WKK Ok MZ 16— T EIT BZEZEJĘMO , ERE E IAK 
RAOR FK A RAA ASE, ERJ A ERRER, MR E FIER, RERE 
逆 过 程 发 生 , 它 就 会 被 生产 出 来 ,而 能 量 不 会 无 中 生 有 , 它 只 能 从 一 种 形式 转化 为 另 一 种 形式 。 

2) 热 力学 第 二 定律 的 推广 一 一 耗 散 结构 

1956 年 ,法 国 物 理学 家 工 . 布 举 渊 (L* Brillouin) 将 信息 炉 与 热力 学 炉 直 接 联 系 起 来 ,成 功 地 
建立 了 信息 的 物理 模型 和 广义 增 炉 原 理 , 并 提出 了 “信息 的 负 粹 原理 ”, 即 信息 与 负 坑 等 价 。 

1969 年 ,比利时 物理 化 学 家 普 里 高 津 (Prigogine) 针 对 非 平衡 统计 物理 学 的 发 展 ,从 热力 学 
第 二 定律 出 发 ,正式 创立 了 一 种 非 平衡 态 开 放 系统 的 自 组 织 理论 一 一 耗 散 结构 论 。 该 理论 被 
EA 70 年 代 化 学 的 辉煌 成 就 之 一 ,并 寺 1977 年 荣获 了 诺 贝尔 化 学 奖 。 

普 里 高 津 宣称 : 非 平衡 可 能 成 为 有 序 之 源 ,而 不 可 逆 过 程 导 致 所 谓 耗 散 结构 这 一 种 新 型 
的 物质 动态 。” 
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FEE MIE (Prigogine) FAERIE RHE BHET APA KN — BOLEK 
dS 可 以 表示 为 两 项 之 和 
dS = d,S + d,S (8 - 8) 
式 中 ,d5 HWRE: d, S YKK ŻE; d 5 JKA Eo 
d.5 Eh FRR SIAR ETS LE (0487, PUK ZCHŁ. RIT IE. AI fra 
为 零 。 
dS 是 系统 内 各 种 不 可 逆 过 程 所 产生 出 来 的 炉 , 炉 只 能 产生 不 能 磨灭 ,所 以 炉 产 生 具 有 非 
负 性 , 即 4S>0。 
BERRIZ E d. S 可 为 负 值 , 则 式 (8 - 8) FAJKA dS 也 可 出 现 负 值 ,此 时 ,系统 朝 着 炉 减 小 
的 方向 演化 , 即 系统 向 有 序 方向 演化 ,或 称 之 为 进化 , 出现 的 有 序 结构 又 称 耗 散 结构 。 
2. 耗 散 结 构 ( 自 组 织 ) 及 其 产生 的 条 件 
耗 散 结构 是 在 远离 平衡 的 条 件 下 ,借助 于 外 界 的 能 量 流 和 物质 流 而 维持 的 一 种 空间 或 时 
间 的 有 序 结构 。 
1) 退 化 
孤立 系统 和 处 于 非 平 衡 线 性 区 的 开放 系统 总 是 朝 着 均匀 、 无 序 、 简 单 和 低级 的 退化 方向 演 
化 ,好 像 大 自然 在 企图 消灭 万 事 万 物 的 差别 ,以 达到 “全 球 同 此 凉 热 "之 景观 。 
2) 进 化 ( 耗 散 结构 ) 
在 远离 平衡 的 条 件 下 ,借助 于 外 界 的 能 量 流 和 物质 流 而 维持 的 一 种 空间 或 时 间 的 有 序 结 
构 , 也 可 称 为 合作 现象 或 非 平衡 非 线性 现象 。 
能 若 流 人 系统 引起 正 炳 流 , 流 出 引起 负 炳 流 ;物质 流入 系统 引起 负 炉 流 , 流 出 引起 正 炳 流 。 
在 能 基 流 出 和 /或 物质 的 流入 引起 的 负 炳 流 大 于 系统 粹 产生 时 ,系统 向 有 序 方向 演化 ,出 
现 耗 散 结构 ,反之 ,系统 向 退化 方向 演化 。 
3) 耗 散 结构 产生 的 条 件 
(1) 内 部 条 件 。 
线性 系统 只 存在 两 种 演变 前 途 ,不 是 衰亡 就 是 无 限 增长 ,线性 系统 的 定 态 和 非 平衡 约束 是 
-一 对 应 的 , 即 除 热力 学 分 支 外 无 任何 其 它 分 支 存在 。 即 使 外 界 条 件 把 系统 驱动 到 远离 平衡 
态 ,甚至 把 稳定 的 热力 学 分 支 变 为 不 稳定 ,在 不 稳定 热力 学 分 支 附近 的 扰动 也 只 能 无 限 地 发 
展 ,因为 作为 扰动 发 展 归宿 的 其 它 稳定 分 支 不 存在 (图 8-3)。 
稳定 热力 学 分 支 


不 稳定 热力 学 分 支 








N 稳定 耗 散 结构 分 支 
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图 8-3 系统 演化 模式 示意 图 
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而 非 线性 系统 的 演化 具有 多 样 性 ,多 样 性 是 系统 内 部 非 线性 相互 作用 的 结果 。 在 近 平衡 
区 ,由 于 非 线性 项 与 线性 项 相 比 是 个 小 量 而 不 发 挥 作 用 ,这 时 只 存在 热力 学 分 支 单 解 , 当 非 平 
衡 约束 把 系统 驱动 到 运 离 平 衡 态 时 , 非 线性 项 就 发 挥 了 主导 作用 ,一 个 非 平 衡 约束 就 对 应 多 重 
定 态 解 ,有 的 定 态 解 是 稳定 的 ,有 的 是 不 稳定 的 。 在 不 稳定 分 支 附近 的 扰动 随时 间 增长 ,最 后 
演变 到 某 一 稳定 的 分 支 上 ,究竟 选择 哪 一 个 稳定 分 支 是 由 涨 落 来 确定 的 (图 8- 3)。 

非 线性 相互 作用 通常 表现 为 正 反馈 和 负 反 馈 , 正 反馈 使 系统 不 稳定 但 促进 系统 的 发 展 , 负 
反馈 制约 正 反馈 使 系统 趋 于 稳定 。 

(2) 外 部 条 件 。 

在 外 界 驱动 下 达到 非 平 衡 的 非 线性 区 才 有 可 能 出 现 耗 散 结构 。 如 图 8- 3 所 示 , 过 临界 点 
热力 学 分 支 失 稳 , 系 统 进 入 稳定 的 耗 散 结构 分 支 。 

4) 涨 落 导 致 有 序 

温度 .压强 、 能 量 等 宏观 量 都 是 大 量 微观 粒子 行为 的 统计 平均 值 , 而 在 某 一 时 刻 这 些 宏观 量 
的 实际 值 并 不 精确 地 等 于 这 些 平均 值 ,或 多 或 少 有 些 偏离 ,这 些 偏离 就 叫 涨 落 , 涨 落 是 随机 的 。 

当 系 统 远离 平衡 态 时 ,一 个 非 平衡 约束 对 应 多 重 定 态 解 ,有 的 定 态 解 是 稳定 的 ,有 的 定 态 
解 是 不 稳定 的 。 在 不 稳定 分 支 附近 的 扰动 随时 间 增 长 ,最 后 演变 到 某 一 稳定 的 分 支 上 ,究竟 选 
择 哪 一 种 稳定 分 支 是 由 涨 落 来 完成 的 。 

系统 新 的 稳定 有 序 态 是 初始 偶然 的 小 涨 落 被 选择 放大 形成 的 ,一 旦 做 出 某 种 选择 ,其 它 选 
择 就 被 排斥 ,整个 过 程 就 不 可 逆转 ,原来 机 会 均等 的 对 称 性 被 涨 落 给 破坏 ,这 又 被 称 为 对 称 性 
破 缺 。 


四 、 协 同学 和 突变 理论 


协同 学 不 受热 力学 约束 而 从 动力 角度 来 研究 从 无 序 产生 有 序 结构 的 规律 ,其 研究 内 容 为 : 
探索 在 系统 宏观 状态 发 生 质 的 改变 的 转折 点 附近 ,支配 子 系统 协同 作用 的 一 般 性 原理 。 协 同 
学 的 突出 贡献 是 发 现 了 在 分 支点 附近 慢 变 量 支配 快 变 量 的 普遍 原理 并 以 动力 学 表述 ,这 个 原 
理 使 对 自 组 织 形成 的 机 制 有 了 更 深刻 的 认识 。 

突变 理论 是 研究 系统 的 状态 随 外 界 控制 参数 的 连续 改变 而 发 生 不 连续 变化 的 数学 理论 ， 
突变 现象 的 共同 特点 是 :外 界 条 件 的 微 变 导致 系统 宏观 状态 的 剧变 。 突 变 论 为 耗 散 结构 论 Hi 
同学 提供 了 定量 化 工具 。 突 变 论 对 拉 普 拉 斯 的 机 械 决定 论 即 知道 初 态 就 能 预知 终 态 的 线性 思 
维 方式 以 颠覆 性 的 冲击 ,把 偶然 性 与 必然 性 随机 性 与 决定 性 有 机 地 统一 起 来 ,适应 研究 一 切 


第 二 节 ”沉积 盆地 内 部 的 复杂 结构 及 其 产生 的 非 线性 机 制 


沉积 盆地 是 一 个 巨型 的 低温 化 学 反应 器 ,其 中 发 生 着 一 系列 的 化 学 反应 一 物质 传输 一 机 
械 过 程 ,这 些 过 程 之 间 彼 此 相互 影响 ,具有 固有 的 非 线性 的 本 质 特征 ,是 一 个 非 线 性 动力 系统 。 
同时 ,这 一 非 线性 动力 系统 又 是 开放 的 ,系统 与 外 界 之 间 人 存在 物质 交换 (沉积 物 的 堆积 和 剥蚀 ， 
流体 的 流 人 和 流出 ) 和 能 量 交 换 ( 构 造 应 力 、 热 流 )。 

在 含油 气 盆地 这 样 一 个 极其 复杂 的 系统 中 可 出 现 宏 观 上 的 自 组 织 结构 ,而 正 是 这 一 自 组 
织 结构 控制 着 油气 的 生 、 运 、 聚 \ 保 等 过 程 ,决定 了 油气 资源 的 结构 及 时 空 分 布 规律 ,认识 这 一 
自 组 织 结构 的 特征 ,可 有 效 地 研究 油气 藏 形成 和 分 布 的 规律 并 指导 油气 勘探 与 开发 。 
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一 \ 沉 积 盆地 内 部 的 复杂 结构 


在 一 个 正在 沉降 和 接受 充填 的 沉积 盆地 中 ,从 浅 部 到 深部 一 般 可 分 为 上 .中 .下 三 个 次 级 
系统 ,图 8- 4 给 出 了 盆地 的 这 种 结构 特征 。 上 系统 的 典型 特征 是 流体 压力 基本 处 于 正常 状 
态 , 流 体 向 上 自由 排出 ;中 系统 的 典型 特征 是 细 粒 岩层 中 的 水 向 上 或 向 下 排 人 到 相对 高 渗透 的 
粗 粒 岩层 中 ,而 流体 在 后 者 之 中 发 生 连续 的 侧 向 流动 ,在 该 系统 中 流体 异常 压力 现象 开始 出 
现 , 且 细 粒 岩 层 中 的 压力 大 于 相对 高 渗透 的 粗 粒 岩层 中 的 压力 ;在 下 系统 中 流体 流动 受到 限 
制 ,形成 流体 封存 箱 , 箱 内 流体 呈 超 压 状 态 , 压 力 梯度 在 16MPa/km 和 23MPa/km 之 间 , 且 每 个 
流体 封存 箱 内 的 流体 势 可 以 呈 均 衡 状 态 , 处 处 相等 ,流体 主要 沿 断 裂 或 裂缝 带 非常 缓慢 地 连续 
或 呈 幕 式 向 上 排出 ,也 可 突破 侧 封闭 层 侧 向 流动 。 
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图 8-4 正在 沉降 和 接受 充填 的 沉积 盆地 内 部 的 一 般 结构 模式 

沉积 盆地 在 剖面 上 的 结构 性 特点 实际 上 反映 了 盆地 随时 间 的 演化 特征 ,而 这 种 结构 性 特 

点 可 用 图 8 - 5 所 示 的 压力 一 深度 曲线 来 表示 。 把 沉积 盆地 看 作 一 个 天 然 系统 ,其 中 发 生 着 各 

种 物理 和 化 学 作用 ,是 一 个 巨大 的 化 学 反应 器 ,盆地 深部 的 流体 封存 箱 是 非 线性 动力 系统 远离 

平衡 态 时 所 产生 的 自 组 织 现象 。 下 面 ,采用 非 线性 动力 学 的 观点 ,进一步 分 析 从 上 部 到 下 部 盆 
地 系统 的 演化 规律 ,从 而 给 出 关于 盆地 演化 的 一 个 整体 认识 。 


二 ,沉积 盆地 内 部 复杂 结构 成 因 的 非 线 性 机 制 


在 沉积 物 埋 深 不 大 时 ,其 所 处 的 温度 一 应 力 环境 与 沉积 时 相差 不 大 ,为 低能 环境 , 浅 层 低 
能 环境 下 , 随 沉积 物 的 压 实 ,流体 可 以 畅通 地 排泄 ,流体 压力 呈正 常 状态 ,系统 处 于 平衡 态 (图 
8-2 中 的 p 点 ), 系 统 中 流体 柱 之 间 互 不 相关 ,处 于 无 序 状态 ,对 应 于 图 8 - 4 中 的 上 系统 。 

随 着 沉积 物 埋 深 的 增加 ,沉积 物 逐 渐 被 压 实 ,并 伴随 着 各 种 成 岩 作用 而 演化 成 层 ,渗透 性 
降低 , 且 由 于 粘土 矿物 的 定向 排列 作用 ,使 垂 向 渗透 率 低 于 水 平 渗透 率 ,流体 不 能 及 时 沿 垂 向 
排出 ,产生 弱 超 压 现象 ,系统 偏离 平衡 态 ,但 处 于 非 平 衡 线性 区 (图 8- 2 中 的 a 区 ), 不 产生 自 
组 织 现象 , 即 不 出 现 侧 向 流体 封闭 ,形成 图 8 - 4 所 示 中 系统 侧 向 流动 的 特点 。 

随 着 地 层 埋 深 的 增加 ,其 温度 和 地 应 力也 在 不 断 增加 ,沉积 物 本 身 流体 本 身 以 及 沉积 物 
和 流体 之 间 发 生 的 各 种 搬运 ,机械 变形 和 化 学 反应 等 过 程 铺 趋 活 路 ,这 些 过 程 的 共同 作用 使 系 
统 远离 平衡 态 ( 图 82 中 的 b 区 )。 在 远离 平衡 态 的 系统 中 ,出 现 空间 上 和 时 间 上 的 自 组织 现 
象 ,一 方面 在 盆地 深部 营造 出 大 大 小 小 的 高 压 三 维 流体 封存 箱 (图 8 — 4 中 的 下 系统 ), 另 一 方 
面 ,流体 从 封存 箱 中 的 排出 在 时 间 上 表现 为 幕 式 结构 。 
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图 8-5 对 应 图 8- 4 的 压力 一 深度 剖面 

系统 继续 演化 ,更 加 远离 平衡 态 ( 图 8 - 2 中 的 “区 ), 则 系统 在 空间 和 时 间 上 出 现 的 自 组 
织 形 式 就 越 复杂 直至 出 现 混沌 ,在 这 种 高 度 演化 的 系统 中 ,不 利于 大 规模 油气 藏 的 形成 。 

反馈 是 导致 结构 性 出 现 的 一 个 重要 因素 ,在 盆地 中 反馈 是 一 个 常见 现象 , 故 盆地 中 的 空间 
自 组 织 现象 应 该 是 丰富 多 彩 的 。 

真实 的 盆地 只 是 可 变 地 ,动态 地 维持 在 一 类 远离 平衡 状态 ,如 沉积 停止 ,盆地 边界 上 的 热 
应 力 和 热 作用 固定 不 变 , 那 么 盆地 演化 向 岩石 零 孔 隙 度 ,水 在 上 所 有 反应 处 于 平衡 态 。 然 而 ， 
盆地 中 的 沉积 流体 输 人 、 刊 伺 ,应 力 史 非常 复杂 ,在 这 一 历史 过 程 中 ,和 丛 地 可 长 时 间 维 持 在 远 
离 平 衡 态 , 这 期 间 可 出 现 自 组 织 现象 。 

含油 气 盆地 是 一 个 多 变 基 多 过 程 彼此 相互 制约 的 复杂 系统 ,不 同 的 变量 有 不 同 的 变化 速 
率 ,不 同 的 过 程 有 不 同 的 进程 ,变量 之 间 以 及 过 程 之 间 可 能 会 出 现 不 协调 性 ,即便 系统 中 的 许多 
过 程 是 快速 的 和 不 可 逆 的 ,只 要 有 任何 一 个 过 程 处 于 平衡 态 之 外 ,系统 则 可 处 于 整体 上 的 非 平衡 
态 。 在 远离 平衡 态 的 系统 中 ,系统 可 产生 自 组 织 结构 ( 耗 散 结构 ), 而 且 ,系统 出 现 自 组 织 的 可 能 
性 随 其 远离 平衡 态 程度 的 增加 而 增加 ,由 此 可 推断 在 盆地 内 出 现 自 组 织 结构 是 个 普遍 现 象 。 


三 \ 控 制 沉积 盆地 内 部 结构 发 育 的 主要 因素 


图 8- 4 所 示 的 结构 模式 是 在 一 个 正在 沉降 和 接受 充填 的 沉积 盆地 内 部 的 一 般 结构 模式 ， 
这 些 结构 在 什么 深度 出 现 ,取决 于 盆地 系统 在 不 同 深度 上 的 自由 能 差 的 大 小 , 即 系统 远离 平衡 
的 程度 。 在 一 定 深度 上 系统 远离 平衡 的 程度 ,基本 上 可 由 流体 超 压 的 大 小 来 衡量 ,而 流体 超 压 
的 大 小 主要 受 盆地 的 热 史 、 沉 积 ( 降 ) 史 、 构 造 史 的 控制 。 

在 一 个 盆地 中 ,地 温 梯度 越 高 ,沉积 速率 越 大 ,沉积 物 中 的 泥 质 含量 越 大 ,构造 挤 压 越 强 ， 
则 具有 侧 向 流动 特点 的 中 系统 和 高 压 流体 封存 箱 下 系统 出 现 的 深度 就 越 小 ,甚至 可 由 平衡 态 
的 上 系统 直接 过 渡 到 下 系统 的 高 压 流体 封存 箱 ,流体 封存 箱 也 越 复杂 (高 度 进化 的 结果 ) ,表现 
为 大 封存 箱 内 套 小 封存 箱 的 多 重 巢 状 结构 和 /或 箱 内 强烈 的 非 均 质 性 。 反 之 , 则 中 系统 和 下 系 

a 





统 出 现 的 深度 就 越 大 ,下 系统 的 流体 封存 箱 也 越 简单 ,甚至 不 出 现下 系统 流体 封存 箱 。 

当 贫 地 停止 下 沉 , 并 出 现 地 层 抬升 剥蚀 ,以 上 的 结构 模式 就 可 能 得 到 调整 。 图 8 - 4 中 的 
上 系统 变 成 正常 压力 状态 下 垂 向 重力 驱动 流 系统 ;中 系统 在 盆地 边缘 强烈 抬升 的 情况 下 可 能 
被 淡水 侵 人 而 变 成 侧 向 重力 驱动 流 系统 ;下 系统 高 压 流体 封存 箱 内 的 压力 降低 ,在 一 定 的 条 件 
下 可 转化 为 低压 流体 封存 箱 。 

如 何 定量 地 研究 盆地 的 热 史 ,沉积 ( 降 ) 史 ,构造 史 对 盆地 系统 结构 的 控制 作用 ,获得 盆地 
演化 阶段 的 指示 性 指标 (如 炳 变 的 方向 ) ,是 目前 地 学 界 遇 到 的 一 个 挑战 ,需要 多 学 科 联合 攻关 。 


第 三 节 ”分形 的 起 源 与 基本 概念 


一 、 自 然 现象 的 复杂 性 和 分 形 的 提出 


古代 的 几何 学 在 希腊 曾 大 放 异 彩 ,但 它 研 究 的 图 形 只 是 能 用 圆规 和 直 尺 画 出 来 的 简单 图 
形 ,这 样 的 图 形 全 都 是 平滑 的 。 牛 顿 微 积 分 学 创立 后 ,由 微 积分 学 和 几何 学 的 结合 ,使 数学 能 
表现 更 为 复杂 的 形状 ,但 这 些 几何 形状 的 重要 特征 是 具有 特征 长 度 , 是 平滑 的 和 可 微分 的 。 然 
而 ,自然 现象 或 自然 界 出 现 的 某 些 图 形 是 非常 复杂 的 ,如 山脉 的 起 伏 、 海 岸 线 的 形态 变化 等 ,很 
难 用 欧 几 里 得 几何 或 牛顿 的 微 积分 学 来 描述 ,对 于 这 类 复杂 现象 的 描述 需要 建立 新 的 数学 方 
法 和 引入 新 的 数学 工具 。 

在 复杂 的 自然 现象 或 几何 图 形 中 ,有 一 类 具有 自 相似 性 或 膨胀 对 称 性 , 即 局 部 与 整体 在 形 
A .功能 和 /或 信息 等 方面 具有 统计 意义 上 的 自 相 似 性 , 自 相似 性 或 膨胀 对 称 性 又 称 标 上 度 不 变 
性 或 无 标 度 性 ,如 云彩 的 外 形 和 海岸 线 的 变化 常 被 当 作 自然 界 分 形 的 例子 ,在 不 同 尺度 下 观察 
海岸 线 , 其 形态 具有 相似 性 ,如 图 8-6 所 示 。 同 时 ,用 不 同 长 度 的 尺子 来 丈量 海岸 线 ,得 到 的 
海岸 线 长 度 是 不 同 的 , 即 海岸 线 具 有 无 标 度 性 。 

这 类 具有 白 相似 性 的 现象 或 图 形 称 为 分 形 (fractal)。 分 形 (fractal) 一 词 由 法 国 数学 家 Man- 
delbrot 于 1973 年 首次 提出 ,用 于 描述 自然 界 存在 的 这 类 复杂 现象 。 

分 形 理论 属 非 线 性 科学 的 范畴 , 它 已 发 展 成 非 线性 科学 中 的 一 个 活跃 的 数学 分 支 ,其 研究 
的 对 象 是 在 非 线 性 系统 中 产生 的 不 光滑 和 不 可 微 的 自然 现象 或 几何 形体 ,对 应 的 定量 参数 是 
分 形 的 维 数 。 分 形 对 微分 的 否定 ,既是 对 微 积 分 学 的 补充 和 完善 ,也 是 对 微 积分 学 的 一 个 划 时 
代 的 革命 。 

分 形 扩大 了 人 类 对 白 然 现 象 研究 或 描述 的 范围 ,原来 用 欧 几 里 得 几何 或 牛顿 的 微 积分 学 
无 法 描述 的 现象 ,现在 可 以 借助 分 形 几何 来 研究 了 ,分 形 为 我 们 提供 了 描述 混沌 形态 等 复杂 现 
象 的 新 语言 

二 、 分 形 和 非 分 形 的 实例 


1 .分 形 的 实例 
分 形 是 一 种 复杂 的 自然 属性 或 几何 体 ,大 至 宇宙 星云 的 分 布 ,小 至 准 晶 态 的 晶体 结构 ,在 
地 学 \ 生 物 学 ,物理 学 .化 学 、 甚 至 社会 科学 中 都 广泛 存在 分 形 现象 ,有 人 把 这 种 现象 称 为 分 形 
态 或 分 形体 。 分 形态 是 介 于 无 序 和 有 序 之 间 的 一 系列 状态 ,是 白 然 界 最 广泛 分 布 的 状态 ,这 种 
状态 是 不 稳定 的 ,也 可 能 是 准 稳定 的 ,这 正 是 自然 界 运动 ,发展 演化 的 根本 原因 。 
地 学 中 分 形 的 例子 包括 海岸 线 、 山 的 形态 ,河流 .断裂 系统 地震、 矿石 品位 分 布 等 ;生物 学 
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的 自 相 似 性 
中 的 分 形 包 括 肺 和 血管 的 构造 ,植物 的 构 着 中 的 分 形 包括 星云 的 空间 分 布 月 坑 、 小 
g 的 直径 分 布 ;物理 化 学 中 的 分 形 包括 固体 表面 凝集 体 \ 粘 性 指 进 \ 放 电 式 样 等 

. 非 分 形 的 实例 

尽 RE, 分 形 在 自然 界 是 广泛 存在 的 ,但 并 不 是 所 有 的 复杂 几何 形体 都 是 分 形 ,如 新 的 火山 
锥 、 冲 积 扇 等 自然 几何 体 并 不 具有 分 形 的 特点 


第 四 节 分形 几何 一 一 分 数 维 














1. 拓 扑 维 D, 
个 几何 对 象 的 拓扑 维 数 D, 确定 了 其 中 一 个 点 所 有? 
个 长 方形 中 ,确定 其 中 一 个 点 的 位 置 ,需要 两 个 独立 的 坐标 , 故 长 方形 的 拓扑 维 数 等 于 2 
需要 注意 的 是 ,几何 对 象 的 拓扑 维 与 该 几何 对 象 所 处 空间 的 维 数 是 两 个 不 同 的 概念 。 邻 域 是 
拓扑 学 中 的 一 个 核心 概念 ,一 个 几何 对 象 的 相 邻 点 ,只 要 保持 连续 性 ,无 论 通过 怎样 的 拉 伸 、 压 
缩 .扭曲 变 成 各 种 形状 , 相 邻 的 点 仍然 相 邻 ,所 以 说 拓扑 维 是 拓扑 变换 的 不 变量 
2. 拓 扑 维 的 相似 法 求解 一 一 相似 维 
用 标 度 r 来 分 割 一 个 几何 对 象 ,得 到 的 分 割 图 形 的 个 数 为 
N(r) = | (8-9) 


= 
p 






要 的 独立 坐标 数目 (经 验 维 )。 如 在 






则 用 相似 法 求 得 的 拓扑 维 D, 为 





p, = MOD (8 - 10) 


jn 一 
r 


如 对 图 8- 7 所 示 的 边 长 为 1 的 正方 形 进行 分 割 , 当 r= yit, NO) =4= -一 ,而 "= 


2 


时 ,N(r)=16= ”由 此 可 得 正方 形 的 相似 维 为 2 
4 
对 于 其 它 常见 的 平面 图 形 来 说 ,图 形 面积 4 与 特征 长 度 上 有 
如 下 关系 
正方 形 的 面积 和 边 长 关系 :4= 忆 
贺 的 面积 和 半径 关系 :4 = rR? 


| 
| 等 边 三 角形 的 面积 和 边 长 关系 :c= 鹤 ,4 = d? 
= a 半圆 形 的 面积 和 半径 关系 ;4 = 7R 








8-7 相似 维 的 求 取 总 之 ,在 欧 几 里 得 几何 中 ,物体 的 大 小 或 特征 尺度 与 其 面积 
(容量 .测度 ) 可 用 如 下 关系 表示 
A = CL’ (8-11) 


RP, D, 称 为 欧 几 里 得 空间 几何 形体 的 拓扑 维 数 , C 称 为 标 度 系数 ,L 称 为 特征 尺度 。 

3. 欧 几 里 得 几何 的 特点 

(1D) 维 数 D, 为 整数 : 欧 几 里 得 几何 研究 的 图 形 只 是 用 圆规 和 规 尺 画 出 来 的 简单 图 形 ,这 样 
的 图 形 全 都 是 平滑 的 ,所 定义 的 拓扑 维 数 D, 是 整数 ; 

(2)N(Cr) 随 r 变 小 而 增 大 ,但 几何 对 象 的 总 测度 (总 长 度 ,总 面积 或 总 体积 ) 保 持 不 变 。 


二 、 分 维 数 的 定义 和 计算 
1 .定义 


分 维 数 是 分 形 几何 学 的 特征 基 , 不 同 的 研究 人 员 提 出 了 许多 定义 ,这 里 仅 给 出 Kolomogorov 
容重 维 的 定义 如 下 


= 12 (8 - 12) 


分 维 D, 大 于 拓扑 维 D, ,小 于 分 形 几 何 体 所 处 的 空间 的 维 数 D, 即 D, < D< Do 
2. 分 形体 实例 一 一 科 克 曲线 (Koch 曲线 ) 


图 8- 8 展示 了 Koch 曲线 的 产生 过 程 ,将 这 一 过 程 无 限 地 进行 下 去 ,获得 的 复杂 几何 图 形 
即 为 Koch 曲线 。 


SZ Im = POM a. „ZAL BK CA 


图 8-8 Koch 曲线 ( 科 克 曲线 ) 
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下 面 ,我 们 根据 Kolomogorov 容量 维 的 定义 ,来 计算 Koch 曲线 的 分 维 数 。 
根据 Koch 曲线 的 生成 过 程 ,我 们 有 
当 r=1 时 ,N(r) = 1,L(r) = 1 


当 r = 于 时 ,N(r) = 4,L(r) = 3 


Hr = (G NO) = 16 = £,L(r) = (ŻY 


由 此 可 得 
当 r = DNO) = 8L) = (ŻY 
根据 式 (8 - 3) 的 定义 ,可 得 Koch 曲线 的 分 维 数 为 


In 
r 


另外 ,也 可 以 发 现 , 当 n=wltf, L(r)-> o, B0 r0 Hf, Koch 曲线 的 总 长 度 CCr) 一 om。 
3. 分 形 几何 与 欧 几 里 得 几何 的 对 比 
表 8- ! 归纳 出 分 形 几何 和 网 几 里 得 几何 的 不 同 特点 。 


表 8-1 分 形 几何 与 欧 几 里 得 几何 对 比 表 
饮 几 里 得 几何 分 形 几何 








4. 分 维 数 的 计算 方法 一 一 计 铭 维 数 (Box — Counting Method) 
用 边 长 为 r 的 盒子 履 盖 图 形 , 数 出 有 图 形 的 盒子 数 N(r) ,变换 7, 得 出 [LN(r),17] 的 数据 
对 ,把 [LN(7),1/r] 数 据点 对 投 到 双 对 数 坐 标 中 , 求 出 直线 的 斜率 ,该 斜率 即 为 分 维 数 (图 8 - 9)。 


r 


logtlr) 








图 8-9 分 维 数 的 计 念 维 数 法 
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第 五 节 分形 问题 讨论 


一 ,分 形 定义 的 讨论 


FI Mandelbrot (1973) 给 出 了 分 形 的 定义 以 后 ,1986 年 又 对 分 形 的 定义 作 了 修正 ,修正 后 的 
定义 为 ;分形 是 指 由 各 个 部 分 组 成 的 形态 组 成 的 整体 ,每 个 部 分 以 某 种 方式 与 整体 相似 。 对 这 
一 定义 加 以 引申 , 它 包括 如 下 含义 : 

(1) 分 形 既 可 以 是 几何 图 形 , 也 可 以 是 由 “功能 "或 “信息 "构建 的 数理 模型 ; 

(2) 分 形 可 以 同时 具有 形态 ,功能 和 信息 等 多 方面 的 自 相似 性 ,也 可 以 只 有 其 中 某 一 方面 
的 自 相似 性 ; 

(3) 自 相似 可 以 是 严格 的 ,也 可 以 是 统计 意义 上 的 相似 ,自然 界 的 大 部 分 分 形 都 是 统计 自 
相似 ,而 不 是 局 域 放 大 一 定 倍数 以 后 ,简单 地 与 整体 完全 重合 ,但 是 分 形 维 数 并 不 会 因 放大 或 
缩小 等 操作 而 变化 ( 即 分 形体 具有 伸缩 对 称 性 ); 

(4) 相 似 性 有 层次 结构 上 的 差异 ,数学 中 的 分 形 具有 无 限 嵌 套 的 层次 结构 ,而 自然 界 中 的 
分 形 只 有 有 限 层 次 的 氮 套 , 旦 要 进入 到 一 定 的 层次 结构 以 后 才 有 分 形 的 规律 ; 

(5) 相 似 性 有 级 别 (即使 用 生成 元 的 次 数 或 放大 倍数 ) 上 的 差异 ,级 别 最 高 的 是 整体 ,最 低 
的 称 为 0 级 生成 元 ,级 别 愈 接近 则 愈 相 似 ,级 别 相 益 越 大 ,相似 性 愈 差 。 相 似 性 级 别 可 用 无 标 
度 区 间或 标 度 不 变性 范围 表示 。 

二 、 分 形 与 复杂 系统 


传统 科学 把 观察 到 的 无 序 状态 作为 有 序 系统 的 一 种 摄 动 ,认为 无 序 系统 继承 了 有 序 系统 
的 物理 或 化 学 实质 , 与 有 序 系统 的 偏差 是 很 小 的 ,但 现代 非 线性 系统 理论 告诉 我 们 ,如 果 无 序 
性 很 强 , 我 们 不 能 指望 从 有 序 系统 理论 了 解 系统 的 更 多 信息 。 分 形 理论 恰恰 适应 于 无 序 系统 ， 
它 把 无 序 性 看 成 是 系统 固有 的 性 态 ,而 不 是 把 它 看 成 摄 动 。 在 区 分 强 无 库 和 能 无 序 时 ,其 效果 
也 十 分 明显 

说 一 个 系统 是 弱 无 序 的 ,如 果 我 们 用 逐渐 减 小 的 尺度 (对 连续 模型 ) 或 用 逐渐 增 大 的 尺度 
(对 点 阵 模型 ) 来 考察 或 探测 菜 -系统 时 ,无 序 性 消失 。 如 水 晶体 表面 和 玻璃 ,在 小 尺度 或 大 尽 
度 下 ,无 序 性 与 平移 不 变 参考 态 有 确定 的 偏离 。 强 无 序 指 在 小 尺度 或 大 尺度 下 ,无 序 性 仍然 保 
持 日 不 存在 可 与 系统 比较 的 参考 夸 。 因 此 ,无 序 性 在 所 有 标 度 上 的 重复 ,对 应 于 分 形 几何 中 结 
构 之 内 结构 的 重复 性 ,结果 它 的 几何 形状 就 不 同 二 经典 几 何 图 , 即 它 是 分 形 。 分 形 维 数 与 拓扑 
维 数 的 差 值 D, - D, 是 系统 无 序 程度 的 其 度 之 -。 = D, 的 大 多 数 系统 是 有 序 或 弱 无 序 的 ， 
D, > D, 的 系统 是 强 无 序 的 

分 维 数 是 粗粮 度 (不 平 度 ) 的 一 种 度量 ,是 物体 占据 空间 能 力 的 一 种 量度 。 分 形 是 自然 界 
中 普遍 存在 的 现象 ,但 并 不 是 所 有 的 自然 现象 都 是 分 形 结构 ,有 两 方面 的 解释 : -是 从 分 形 形 
成 的 机 制 上 来 看 ,有 些 过 程 不 产生 分 形 ; 二 是 从 无 标 度 区 间 的 范围 来 看 ,在 无 标 度 区 问 之 外 , 自 
相似 性 消失 或 不 存在 - 


三 、 关 于 分 形 分 布 和 自 相似 性 


分 形 分 布 要 求 大 于 某 一 尺度 物体 的 数目 与 物体 大 小 之 间 存在 短 函 数 关系 
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PIZ> zl œ z” (8 - 13) 
X FIE MAŚCI FARBE KIETE—IWZPM ,但 宕 指数 分 布 是 惟一 不 含 特征 长 
度 的 分 布 。 分 形 系统 在 伸缩 变换 下 保持 不 变 且 空间 坐标 x、y 和 z 按 相同 比例 伸缩 (各 向 同性 
无 序 ) ,更 一 般 的 自 仿 射 系统 在 不 同 的 方向 上 有 不 同 的 伸缩 比例 。 有 序 系统 也 是 伸缩 不 变 的 ， 
而 且 它 还 具有 平移 不 变性 ,而 分 形 则 失去 了 平移 对 称 而 保持 了 伸缩 对 称 。 事 实 上 ,每 种 无 序 都 
以 某 种 方式 破坏 了 平移 对 称 性 ,这 说 明 具有 整数 维 1.2.3 的 系统 是 复杂 分 形 系统 退化 的 ,而 非 
整数 维系 统 没有 这 种 退化 。 
以 上 关于 自 相似 性 的 定义 是 从 数学 角度 出 发 的 ,从 物理 学 角度 出 发 , 自 相 似 性 是 指 某 种 结 
构 或 过 程 的 特征 从 不 同 的 空间 尺度 或 时 间 尺 度 来 看 都 是 相似 的 ,或 者 某 系统 或 结构 的 局 域 性 
质 或 局 域 结构 与 整体 类 似 。 自 相似 性 是 标 度 不 变性 的 同 义 请 , 它 强调 系统 在 各 种 尺度 上 是 相 
似 的 这 一 事实 。 


第 六 节 ”分形 在 油气 勘探 开发 中 的 应 用 


近 几 年 来 ,国内 外 许多 专家 ,如 Bale(1984)、Katz(1985)、Krohn(1986) 、Avnir(1985) 及 沈 平平 
(1994) 和 李 克 文 等 (1993) 发 表 了 他 们 对 储 层 非 均 质 性 、 砂 岩 等 储 集体 中 孔隙 结构 等 问题 进行 的 
大 量 研究 结果 ,这些 研 究 发 现 储 层 的 非 均 质 性 及 多 孔 介质 的 孔隙 结构 是 一 种 分 形 结构 。 尽 管 他 
们 测定 或 计算 分 形 维 数 的 方法 不 同 , 他 们 都 用 分 形 维 数 描述 各 自 的 研究 对 象 ,取得 了 较 好 的 应 用 
效果 。 下 边 就 分 形 理论 在 油气 储 层 勘探 开发 和 评价 中 的 应 用 介绍 其 基本 原理 和 实现 过 程 。 


一 、 分 形 方法 在 岩石 孔隙 结构 研究 中 的 应 用 


1. 用 图 像 分析 技 术 研 究 孔 隙 结构 的 分 形 维 数 

该 方法 是 根据 测度 关系 求 取 注 片 岩 样 的 分 形 维 数 ( 李 克 文 ,1993) ,具体 作法 如 下 : 

(1) 将 洗 油 烘 干 的 薄片 样品 在 高 压 下 灌注 染色 环 氧 树 脂 ,冷却 后 磨 成 薄片 ; 

(2) 在 一 定 倍数 的 显微镜 下 将 薄片 拍 成 彩色 照片 ,再 将 彩色 照片 输入 计算 机 ,获得 彩色 图 
像 ,提取 反映 孔 际 特征 的 二 值 图 像 ,用 图 像 分 析 软 件 进行 图 像 分 析 ; 

(3) 在 处 理 好 的 二 值 图 像 上 ,随机 地 选取 一 个 点 作 圆心 ,用 一 半径 夯 圆 , 数 出 该 圆 内 孔隙 所 
占 的 点 数 N(7); 

(4) 作 出 不 同 的 7 与 相应 的 N(r) 之 间 的 关系 , 若 N(r) 与 间 满 足 如 下 宕 指数 关系 , 即 
N(r)e 路 , 则 在 对 数 坐 标 上 直线 的 斜率 即 是 孔隙 分 布 的 分 形 维 数 。 

2. 利 用 压 尔 毛管 压力 曲线 研究 孔隙 结构 的 分 形 维 数 

利用 毛管 压力 曲线 计算 孔隙 结构 的 分 形 维 数 是 一 种 新 型 的 分 维 计算 方法 ( 沈 平 平 ,1994)， 
该 方法 是 根据 压 汞 获得 的 毛管 压力 P. 与 砂岩 样品 中 进 东 饱和 度 的 5 之 间 的 关系 , 求 得 进来 
饱和 度 与 孔隙 喉 道 半 径 r 之 间 的 关系 ,然后 确定 在 任意 给 定 的 孔隙 喉 道 半径 r. 时 ,计算 所 有 
大 于 r. 的 喉 道 数 ,统计 大 于 r. 喉 道 出 现 的 概率 P(r > re) ,利用 分 形 理论 求 得 分 形 维 数 。 具 体 
操作 步骤 如 下 : 

(1) 对 砂岩 样品 进行 压 示 实验 ,绘制 毛管 压力 P. 与 进 隶 饱和 度 Si 之 间 的 关系 ; 

(2) 将 毛管 压力 P. 按照 著名 的 Washbum 方程 换算 成 喉 道 半径 

54161: 
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r P (8 - 14) 


式 中 ,o 是 水 银 表面 张力 ,9 是 水 银 与 岩石 的 接触 角 。 

(3) 根 据 Sm 一 r 的 关系 ,计算 所 有 大 于 某 -随机 给 定 r 的 喉 道 数 ,统计 大 于 r. 喉 道 出 现 
的 概率 P(r >r); 

(4) 在 双 对 数 坐标 纸 上 ,绘制 喉 道 出 现 的 概率 P(r > re) 与 r 的 关系 曲线 , 若 为 直线 , 则 直 
线 的 斜率 即 为 分 形 维 数 。 


二 、 分 形 方法 在 储 层 的 非 均 质 性 研究 中 的 应 用 


1. 分 形 理论 井 间 变量 插值 的 应 用 
自从 Hewett(1986) 发 表 了 用 分 形 理论 描述 和 评价 储 层 非 均 质 的 文章 后 ,分 形 理论 很 快 在 
石油 工业 界 受到 了 重视 ,其 中 很 重要 的 原因 之 -- 是 目前 缺乏 可 用 的 储 层 井 间 参 数 的 预测 和 描 
述 方法 。 
分 形 插值 提供 了 在 只 有 两 口 并 资料 的 情况 下 ,对 并 间 的 变量 值 进行 插值 的 方法 ,在 只 有 两 
口 井 的 情况 下 (图 8 - 10) ,第 六 章 中 的 克 立 金 方程 组 可 写成 
A,Y(0,1) + p = 7(1,x) 
A27(0,1) + p = 7(0,x) (8 - 15) 
Àth =l 
在 非 均 质 多 元 介质 中 ,物体 运 移 取决 于 渗透 性 分 布 的 空间 相关 性 ,沉积 环境 中 物性 参数 测 
量 结果 分 析 表 明 在 长 距离 相关 中 存在 分 形 特点 。 具 有 分 形 特点 的 变量 ,其 变 差 函数 可 由 下 式 
RKR: 


Yh) = TELZ(A) - Zla + WP = A vah” (8 - 16) 
RH, V, 为 系数 项 ;及 H Hurst 指数 。 
Hurst 指数 由 以 下 关系 式 求 取 
H = D, - D; (8 - 17) 
AF, D, 为 拓扑 维 数 ; D, 为 分 维 数 。 
将 Ch) = y Wi2e 代 入 线 性 插值 公式 求解 得 
2 (x) = FIA - w)z(0) + (1 + w)z(h)] (8 - 18) 


x 

2. 分 形 维 数 与 储 层 分 类 

对 国内 多 个 油田 的 砂岩 样品 的 孔隙 结构 的 分 析 统 计 表 明 ,砂岩 样品 具有 明显 的 分 形 结构 ， 
而 且 所 测 的 分 形 维 数 在 2.40 ~ 2.97 之 间 , 图 8- 11 是 国内 6 个 油田 178 块 岩 样 测 得 的 分 形 维 
数 分 布 ( 沈 平平 ,1982)。 从 统计 结果 看 ,分 形 维 数 愈 小 , 则 和 孔隙 均匀 , 储 集 性 好 ; 反之 , 则 孔隙 
不 均匀 , 储 集 性 不 好 。 

图 8- 12 给 出 了 从 某 岩 样 铸 体 薄 片 得 到 的 孔隙 结构 图 像 ,图 中 的 黑色 部 分 是 充满 铸 体 的 
孔隙 空间 。 从 图 中 可 以 看 到 ,该 岩 样 孔 辽 结构 连通 性 好 , 粘 上 上 含量 小 ,是 第 一 类 孔隙 结构 的 储 
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层 ,其 对 应 的 孔隙 分 维 数 在 2.4 左右 (图 8- 13)。 
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图 8- 10 EPN E HEE RE NFL ERE 8-11 国内 6 个 油田 178 块 岩 样 测 得 的 分 形 维 
数据 ) ,进行 井 间 揪 值 的 示意 图 数 分 布 ( 据 沈 平平 ,1986) 





n — a 
A” | 
10 ed 
m 6 
9 6 
z „60 
Es go 
© | 
11 o? 
go 
63 ; Eleni 
35 40 45 50 SS 60 
wao 
图 8-12 KEREJ FLIRE HR 图 8-13 图 8-12 对 应 的 孔隙 分 形 特征 


图 8-14 给 出 了 从 另 一 个 岩 样 铸 体 薄片 得 到 的 孔隙 结构 图 像 , 该 岩 样 孔隙 结构 好 ,粘土 含 
其 有 所 增加 ,孔隙 的 连通 性 差 , 是 第 二 类 孔隙 结构 的 储 层 , 测 出 的 分 形 维 数 为 2.5 ~ 2.6。 

图 8- 15 给 出 了 从 又 一 个 岩 样 铸 体 薄片 得 到 的 孔隙 结构 图 像 ,该 岩 样 大 颗粒 之 间 的 孔隙 
被 小 颗粒 及 胶结 物 充填 ,粘土 含量 大 大 增加 ,孔隙 结构 相当 复杂 。 总 体 上 看 , 孔 院 少 而 小 , 孔 院 
分 布 极 不 均匀 ,是 第 四 类 储 层 , 测 出 的 分 形 维 数 为 2.9 以 上 。 

综 上 所 述 , 用 砂岩 储 层 的 孔隙 结构 的 分 形 维 数 可 以 进行 储 层 分 类 ,其 描述 结果 与 微观 均 质 
系数 的 分 类 和 油田 水 驱 开 发 的 实际 效果 吻合 较 好 ,可 以 作为 评价 油 藏 孔隙 结构 和 储 层 性 能 的 

-个 主要 指标 。 

3. 多 段 分 形 特征 与 储 层 孔隙 结 构 

从 现 有 的 文献 看 ,采用 分 形 方 法 描述 岩石 孔 阶 结构 特征 时 ，- 般 只 考虑 孔隙 结构 的 线性 或 
一 小 段 的 分 形 分 布 ,如 图 8 - 16 所 示 的 线性 段 。 然 而 ,实际 工作 发 现 ,由 于 储 层 孔 隙 结构 的 复 
杂 性 ,实测 的 毛管 压力 曲线 往往 表现 出 多 个 分 段 的 特征 ,如 图 8- 17 所 示 。 

从 图 8- 16 可 以 看 到 ,分 形 曲线 可 以 分 成 喉 道 半径 小 于 某 个 值 r. 和 大 于 该 值 的 两 个 部 
分 。 根 据 分 形 理论 ,对 应 于 直线 部 分 的 孔隙 具有 白 相似 性 特征 , 称 为 分 形 孔 隙 ,而 对 应 于 非 直 
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MA 8- 16 分 形 分 布 的 线性 段 特征 图 8-17 实测 毛管 压力 曲线 的 多 段 分 布 特征 
线 部 分 的 孔隙 称 为 非 分 形 孔隙 。 由 于 沉积 环境 和 成 岩 作 用 的 不 同 ,孔隙 结构 表现 出 多 种 多 样 
的 特征 也 是 自然 现象 复杂 性 的 表现 之 一 。 

图 8-18 给 出 了 从 某 油 田 砂 岩 样品 测 得 的 多 段 分 形 特征 ,反映 了 该 区 存在 三 类 孔隙 分 布 ， 
对 应 于 储 层 的 不 同 地 质 特征 。 和 孔隙 平均 半径 大 于 ro 的 区 域 为 且 区 ,尽管 也 表现 为 直线 分 布 但 
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图 8-18 某 油田 砂岩 样品 测 得 的 多 段 分 形 特征 





与 其 它 两 个 区 域 的 孔隙 分 布 特征 明显 不 同 ;孔隙 平均 半径 大 于 r 小 于 m MIRY I, 孔隙 
平均 半径 小 于 r, 的 区 域 为 工区 ,从 薄片 分 析 资料 看 ,孔隙 平均 半径 小 于 ro 的 两 个 区 域 都 表现 
为 分 形 结构 ,但 具有 不 同 的 分 形 维 数 , [区 称 为 分 形 大 孔隙 区 域 ,而 工区 称 为 分 形 小 孔隙 区 域 ， 
这 两 类 孔隙 区 域 与 开发 时 的 无 水 采 收 期 密切 相关 。 分 维 大 的 区 域 标志 着 非 均 质 性 强 ,水 驱 推 
进 不 均匀 ,因此 ,无 水 采 收 期 短 。 

三 ,分 形 在 油气 藏 规模 研究 中 的 应 用 

1 .成 藏 ( 富 集 ) 过 程 

在 研究 矿产 富 集 规律 时 ,南非 矿业 统计 学 家 De Wijis 提出 一 个 服从 对 数 正 态 分 布 的 富 集 
模型 (图 8 - 19a)。 在 该 模型 中 , 岩 体 先 分 成 相等 的 两 半 , 再 分 成 相等 的 4 份 ,如 此 进行 下 去 以 
至 无 穷 , 而 矿物 越 来 越 集中 在 越 来 越 小 的 体积 中 。 图 8 - 19a 给 出 了 三 级 成 矿 过 程 ,在 每 一 级 
成 矿 过 程 中 , 原 胞 的 一 半 按 富 集 因子 9, 变 得 富 集 , 而 另 一 半 按 因子 (2 - 加 ) 变 得 贫乏 。 这 个 模 
型 给 出 的 储量 与 品位 间 的 关系 是 二 项 式 分 布 , 当 分 割 体积 非常 小 时 ,将 会 得 到 两 者 之 间 的 对 数 
正 态 分 布 。 在 De Wijis 模型 思路 的 启发 下 ,Turcotte 提出 一 个 服从 宕 函数 分 布 的 富 集 模型 , 见 
图 8- 19(b)。 在 Turcotte 模型 中 , 岩 体 的 分 法 与 De Wijis 模型 相同 ,但 进一步 的 成 矿 浓缩 限制 
于 最 高 品位 的 矿石 之 中 ,这 将 导致 储量 与 品位 间 出 现 短 函 数 (分 撒 ) 分 布 关系 。 
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(b) Turcote 模型 
KH 8- 19 矿产 窗 集 的 De Wijis 模型 和 Turcone 模型 
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De Wijis 模型 是 在 研究 了 矿产 资源 量 与 矿石 品位 之 间 统计 关系 的 基础 上 建立 起 来 的 , 难 
以 反映 成 矿 机 理 。 和 De Wijis 模型 相 比 ,Turcotte 模型 强调 进一步 的 成 矿 浓缩 限制 于 最 高 品位 
的 矿石 之 中 ,从 直观 上 来 看 这 似乎 比较 确切 地 反映 了 成 矿 的 规律 ,而且 Turcotte 模型 是 建立 在 
一 定 的 理论 基础 之 上 的 。 在 固体 矿产 资源 预测 中 ,分 形 模型 越 米 越 广泛 地 被 应 用 ,也 从 另 一 方 
面 说 明了 Turcotte 模型 的 合理 性 。 

2. 油 气 藏 规模 分 布 

在 图 8- 4 的 中 系统 中 形成 的 油气 藏 群 ,在 成 因 上 相互 联系 ,具有 上 述 Turcotte 过 程 或 多 重 
Turcotte 过 程 的 特点 ,油气 藏 规模 分 布 服从 分 形 分 布 是 有 成 因 依据 的 。 

在 图 8-4 的 上 系统 中 形成 的 油气 藏 群 ,在 成 藏 的 静态 因素 上 有 联系 ,而 在 成 藏 的 动态 因 
素 上 没有 联系 ,油气 藏 可 能 是 深部 油气 向 上 运 移 充 注 局 部 有 利 图 闭 形成 的 ,也 可 能 是 由 原生 的 
低 熟 油气 在 局 部 有 利 条 件 下 形成 的 ,不 具备 Turcotte 过 程 的 特点 ,每 个 油气 藏 的 规模 受 局 部 条 
件 控制 而 相互 之 间 相 对 独立 ,从 概率 意义 上 来 看 上 系统 中 的 油气 藏 群 的 规模 分 布 倾向 于 服从 
正 态 分 布 。 

在 图 8 - 4 的 下 系统 中 形成 的 油气 藏 群 ,油气 藏 的 规模 主要 受 圈 闭 容量 (流体 封存 箱 的 大 
小 ) 的 控制 ,而 深部 流体 封存 箱 是 由 于 系统 远离 平衡 态 所 形成 的 自 组 织 结构 ,这 种 自 组 织 结构 
可 能 具有 分 形 特征 ,也 可 能 不 具有 分 形 特征 (Oroleva,1994) ,其 规模 分 布 可 能 出 现 分 形 分 布 ,对 
数 正 态 分 布 及 正 态 分 布 等 不 同 的 情形 ,导致 油气 藏 的 规模 分 布 可 能 出 现 多 种 情形 。 

从 概率 论 和 统计 炳 的 观点 来 看 ,从 分 形 分 布 到 对 数 正 态 分 布 ,从 对 数 正 态 分 布 到 正 态 分 
布 ,从 正 态 分 布 到 均匀 分 布 ,代表 着 系统 增 炉 退 化 (系统 抬升 ,由 封闭 变 为 垂 向 上 开启 ) 或 者 系 
统 高 度 进化 (系统 埋 深 增加 ) 至 出 现 混沌 态 的 两 种 演化 趋势 。 从 分 形 分 布 到 对 数 正 态 分 布 ,从 
对 数 正 态 分 布 到 正 态 分 布 ,从 正 态 分 布 到 均匀 分 布 ,系统 的 含油 气 性 由 好 到 差 ,均匀 分 布 是 一 
种 极限 情况 ,代表 系统 中 没有 形成 规模 性 油气 藏 (图 8 - 20)。 
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图 8- 20 油气 成 藏 流体 动力 系统 含油 气 性 的 演化 模式 
现今 存在 的 油气 藏 群 ,其 规模 的 分 布 既 受 油气 藏 群 形成 时 的 规模 分 布控 制 ,又 受 后 期 演化 
程度 的 控制 ,不 同 的 规模 分 布 率 都 可 能 出 现 ,但 富 含油 气 盆地 内 中 系统 中 的 油气 藏 群 ,更 可 能 
有 具有 分 形 分 布 结构 ,而 上 系统 中 的 油气 藏 群 更 可 能 具有 正 态 分 布 结构 ,下 系统 中 的 油气 藏 群 规 
模 分 布 情况 就 要 复杂 得 多 。 总 之 ,在 不 同 的 石油 地 质 条 件 下 ,可 能 表现 为 不 同 的 规模 分 布 率 。 
大 量 研究 也 发 现 ,在 勘探 程度 比较 高 的 盆地 中 , 单 井 累积 探 明 平均 油气 储 重 与 勘探 井 数 之 
间 的 关系 可 由 下 式 表示 





N, ~ 多 (8 - 19) 
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AP NN, 一 一 单间 累积 探 明 平均 油气 储量 , Mm / 井 ; 
殉 一 一 所 钴 探 井 的 数量 ; 
DD 一 一 分 维 数 。 
根据 历史 数据 ,可 求 出 分 维 数 D,, 并 可 根据 以 上 关系 式 对 未 来 钻探 所 发 现 的 储量 进行 预 
测 。 如 Drew&Schuenemeyer 对 1945 ~ 1978 年 间 Louisana 和 Texas 的 勘探 资料 进行 了 分 析 ,得 到 
D, =2.22(% 8-21). 
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图 8- 21 1945 ~ 1978 年 间 Louisana 和 Texas 单 井 探 明 平均 油气 储量 与 钻井 数 的 关系 
在 已 知 总 的 储量 基础 上 ,对 某 一 勘探 区 的 最 终 储量 进行 估计 


R = NO” (8 - 20) 


式 中 R 一 一 单 井 最 终 可 发 现 储量 ,Mm / 井 ; 
NN, 一 一 每 口 井 量 积 发 现 储 基 ,Mm / 井 ; 
一 一 所 钻探 井 的 数量 ; 
WW 一 一 完全 勘探 一 个 含油 气 区 所 需 的 探 井 总 数 。 
公式 (8- 20) 中 的 W, 可 由 下 式 估计 


W = 





(8 - 21) 


>|> 


式 中 4 一 一 勘探 区 总 面积 ,km ; 
4 一 一 给 定 规模 区 的 已 发 现 油气 藏 的 平均 面积 ,km 。 


四 、 分 形 应 用 实例 分 析 


[518-1] 在 中 国 东部 某 止 陷 内 有 2 个 构造 层 (Ts 和 TT,), 每 层 又 可 根据 其 断层 分 布 特点 
划分 为 南北 2 个 区 ,后 再 划分 为 东西 2 个 区 ,2 个 构造 层 (Ts 和 TT) 共 划分 为 8 个 区 ,对 每 个 区 
采用 0. Skm.1km.1.S5km .2km 和 4km 的 5 种 线性 尺度 ( 记 ) 分 别 进行 8 个 区 中 的 断层 网 格 覆盖 ， 
得 到 相应 的 5 个 含 断层 的 网 格 数目 ( N, ) 如 表 8 - 2 所 示 , 试 利用 表 中 数据 求 分 形 维 D、 线 性 尺 
度 大 小 与 含 断层 网 格 数 的 相关 系数 yw 并 进行 计算 结果 的 地 质 分 析 。 

解 :第 一 步 ,利用 计 盒 维 数 法 统计 每 个 线性 尺度 的 网 格 所 含 断层 的 网 格 数 ,结果 如 表 8 - 2 
中 的 第 3 ~7 列 所 示 ; 
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R8-2 TMT, 构造 层 断层 系 的 分 形 数据 及 计算 结果 

































































f 线性 尺度 大 小 计算 结果 
构造 层 4 40.5 10 | bts T 142.0 145 
对 象 x $ + : | s D Yin 
km km km km km 
s 1689 782 534 380 167 1.1034 | 0.99923 
N 1179 560 353 | 255 95 1.2023 | 0.99925 
r E 1569 mo | 468 352 144 1.1363 | 0.9983 
w 1305 os | «9 283 118 "1.1496 | 0.99804 
Ra s 1409 115 © | w | w 1.0880 | 0.99885 
_ N 930 m 273 1% 2 1.1189 | 0.99986 
% E 1453 703 m 39 | Ml 1.1232 | 0.9991 
w 886 454 256 Im 1w | nosz | 0.050 
第 二 步 , 利 用 计 盒 维 数 中 维 数 的 如 下 计算 公式 计算 每 个 区 域 的 分 形 维 数 , 结果 如 表 8 -2 
中 的 第 8 列 所 示 ; 
Dim (F) = - PCO] 


第 三 步 ,利用 相关 系数 计算 公式 计算 每 个 区 域 的 含 断层 的 网 格 数 与 线性 尺度 的 相关 系数 ， 
结果 如 表 8 -2 中 的 第 9 列 所 示 ; 

第 四 步 ,对 结果 的 地 质 分 析 :(1) 从 表 8 - 2 中 列 出 的 相关 系数 可 以 看 到 InL 和 lnw 的 线性 
相关 度 较 高 , 即 所 研究 的 断层 分 布 符合 宕 指数 分 布 规律 ,用 分 形 维 数 D 值 可 定量 描述 该 凹陷 
的 断层 特征 ;(2) 对 T, 构造 层 , 计 算得 到 的 分 形 维 数 有 Dy > Ds 和 Dr > De ,而 对 于 T, 层 构造 
层 , 分 形 维 数 有 Dy > Ds, De > Ds。 从 分 形 维 数 与 几何 分 布 的 复杂 性 关系 知道 ,分 形 维 数 愈 
大 ,几何 图 形 愈 复杂 。 对 应 于 这 一 例 了 ,分 形 维 数 的 大 小 标志 着 断层 的 发 育 程度 。 

表 8- 2 的 结果 表明 该 止 陷 构 造 运动 导致 断层 发 育 程度 为 : 北 高 南 低 。 但 两 个 不 同 构造 层 
东西 两 区 断层 发 育 程度 不 同 。 由 于 断层 在 该 区 对 油气 运 移 聚 集 有 重要 作用 ,所 以 根据 计算 得 
到 的 分 维 值 ,预测 该 凹陷 油气 发 育 程度 为 北 高 南 低 。 根 据 实际 的 油气 生产 情况 证 实 , 该 凹陷 的 
油 藏 储 基 规模 和 产量 都 支持 了 这 个 计算 分 析 结 果 。 


邻 思 考 和 练习 题 令 


1. 如 何 理解 线性 系统 和 非 解 线性 系统 ? 

2. 按照 系统 与 外 界 的 关系 ,系统 有 哪些 分 类 ? 

3. 如 何 理解 混沌 ? 

4. 什么 是 非 欧 氏 几 何 ? 与 欧 氏 几何 有 何 区 别 ? 

5. 试 分 析 如 何 用 压 示 分 析 资 料 计算 孔隙 结构 的 分 形 维 数 ? 

6. 试 用 计 盒 维 数 法 计算 斯 宾 斯 基地 毯 的 分 形 维 数 。 

7. 举 例 说 明 自 然 界 中 有 哪些 是 分 形 现象 为 什么 说 是 分 形体 ? 

8. 除 了 研究 孔隙 结构 外 ,分 形 理论 还 可 在 油气 勘探 开发 的 哪些 方面 应 用 ? 
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附 表 1 标准 正 态 分 布 




















































































































本 表 给 出 了 FO) = 志 -| etd > 0) 的 数值 。 
SIn) -= 
.00 „01 m | .03 „m | .05 06 | o .08 „0 
0.0 0.5000 | 50399 | 50798 | smor | 51595 | s% 52392 | 5270 | 53188 | 53586 
0.1 sw | soso | sars | 552 | 5556 | 55062 | sess | 56749 | sraz | 57535 
0.2 57926 | 58317 | 58706 | 59095 | 50483 
0.3 esi | Gm | 62552 | 629% | 6380 
0.4 65542 | 65910 | 66276 | 66640 | 67033 
0.5 9146 | 67 | 69847 | 70% | 70540 
| 0.6 72575 n | 73237 73891 
0.7 75804 | 76115 | 76424 71035 
0.8 T8814 | 79108 | 79389 19055 
0.9 sis | s1859 | 82121 82639 
1.0 84134 | 84875 | sasia | sasso | 85083 
1.1 86433 | 86650 | 86864 | 87076 | 87286 
1.2 88403 | sa686 | 88877 | 80065 | 80251 
13 9030 | 5040 | 90658 | 90824 | 90988 
1.4 91924 | 92073 | 9220 | 92364 | 92507 
15 93319 9348 | 93574 | 9369 | 93822 
1.6 9450 | 94630 | oss | 94845 | 94950 | 
1.7 95543 | 95637 | 9578 | 9588 | 95907 
| 1.8 960 | 96485 | 96562 | 96638 | 96712 
1.9 omas | m9 | ons? | 91320 | onsi 
2.0 oms | sm | sm | 9182 | 97932 
241 98214 | 98257 | 98300 | 98341 | 98382 
| 22 98610 | 98645 | 98679 | 98713 | 98745 
| 2s | ws | w | ws | woo | sm 
2.4 99180 | 99202 | 99224 | 99245 | 99266 
2.5 99379 | 99396 | 99413 | 99430 | 99446 
2.6 954 | 9054 | 99560 | 9573 | 99585 
2.7 99653 | 99664 | 99674 | 99683 | 99693 
2.8 99144 99152 | 99760 | 99767 | WMA 
2.9 99813 99819 | 99825 99831 99836 
= „0 1 2 3 4 
3 0.99865 | 99903 | 99931 | 99952 | 99966 






































附 表 2 14% 
本 表 给 出 了 满足 P(1t1 > 5) =a 的 4 值 (n 是 自由 度 )。 






































a 
n 0.10 0.05 0.02 0.01 0.001 
ta 
T 
1 6.31 12.71 31.82 63.66 636.62 
2 2.92 4.30 6.97 9.93 31.60 
3 2.35 3.18 4.54 5.84 12.94 
4 2.13 2.78 3.75 4.60 8.61 
5 2.02 2.57 3.37 4.03 6.86 
十 
6 1.94 2.45 3.14 3.71 1.96 
7 1.90 2.37 3.00 3.50 5.41 
8 1.86 2.31 2.90 3.36 5.04 
9 1.83 2.26 2.82 3.25 4.78 
10 1.81 2.8 2.76 3.17 4.59 
u 1.80 2.20 2.72 3.11 4.44 
12 1.78 2.18 2.68 3.06 4.32 
13 1.7 2.16 2.65 3.01 4.2 
14 1.76 2.15 2.62 2.98 4.14 
15 1.75 2.13 2.60 2.95 4.07 
16 1.75 2.12 2.58 2.92 4.02 
17 1.74 2.11 2.57 2.90 3.97 
18 1.73 2.10 2.55 2.88 3.92 
19 1.73 2.09 2.54 2.86 3.88 
20 1.73 2.09 2.53 2.85 3.85 
a 1.72 2.08 2.52 2.83 3.82 
2 1.72 2.07 2.51 2.82 3.79 
23 1.71 2.07 2.50 2.81 3.71 
24 1.71 2.06 2.49 2.80 3.75 
25 1.71 2.06 2.48 2.79 3.3 
26 1.71 2.06 2.48 2.78 3.1 
a 1.70 2.05 2.47 2.71 3.09 
28 1.70 2.05 2.47 2.76 3.67 
29 1.70 2.04 2.46 2.76 3.66 
30 1.70 2.04 2.46 2.75 3.65 
T 
40 1.68 2.02 2.42 2.70 3.55 
60 1.67 2.00 2.39 2.66 3.46 
120 1.66 1.98 2.36 2.62 3.37 
= 1 1.96 2.33 2.58 3.29 


























本 表 给 出 了 满足 Pix*(n) > X:(n)| = a 的 x*(n,a) 值 。 
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n a =0.95 0.99 0.975 0.95 0.90 0.75 
1 一 一 0.001 0.004 0.016 0.102 
2 0.010 0.020 0.051 0.103 0.211 0.575 
3 0.072 0.115 0.216 0.352 0.584 1.213 
4 0.207 0.297 0.484 0.711 1.064 1.923 
5 0.412 0.554 0.831 1.145 1.610 2.675 
6 0.676 0.872 1.237 1.635 2.204 3.455 
1 0.989 1.239 1.690 2.167 2.833 4.255 
8 1.344 1.646 2.180 2.733 3.490 5.071 
9 1.735 2.088 2.700 3.325 4.168 5.89 
10 2.156 2.558 3.247 3.940 4.865 6.737 
n 2.603 3.053 3.816 4.575 5.578 1.584 
12 3.074 3.511 4.404 5.226 6.304 8.438 
13 3.565 4.107 5.009 5.892 1.042 9.299 
14 4.075 4.660 5.629 6.511 1.790 10.165 
15 4.601 5.229 6.262 1.261 8.547 11.037 
16 5.142 5.812 6.908 1.962 9.312 11.912 
17 5.697 6.408 1.564 8.672 10.085 12.792 
18 6.265 1.015 8.231 9.390 10.865 13.675 
19 6.844 1.633 8.907 10.117 11.651 14.562 
20 1.434 8.260 9.591 10.851 12.553 15.452 
a 8.034 8.897 10.283 11.591 13.240 16.344 
22 8.643 9.542 10.982 12.338 14.042 17.240 
3 9.260 10.196 11.689 13.091 14.848 18.137 
24 9.886 10.856 12.401 13.848 15.659 19.073 
25 10.520 11.524 13.120 14.611 16.473 19.939 
26 11.160 12.198 13.844 15.379 17.292 20.843 
n 11.808 12.879 14.573 16.151 18.114 21.749 
28 12.461 13.565 15.308 16.928 18.939 22.657 
29 13.121 14.257 16.047 17.708 19.768 23.567 
30 13.787 14.954 16.791 18.493 20.599 24.478 
31 14.458 15.655 17.539 19.281 21.434 25.390 
32 15.134 16.362 18.291 20.072 22.271 26.304 
33 15.815 17.074 19.047 20.867 23.110 27.219 
4 16.501 17.789 19.806 21.664 23.952 28.136 
35 17.192 18.509 20.569 22.465 24.797 29.054 
36 17.887 19.233 21.336 23.269 25.643 29.973 
37 18.586 19.960 22.106 24.075 26.492 30.893 
38 19.289 20.691 22.878 24.884 27.343 31.815 
39 19.99 21.426 23.654 25.695 28.196 32.737 
40 20.707 22.164 24.433 26.509 29.051 33.660 
41 21.421 22.906 25.215 27.326 29.907 34.585 
42 22.138 23.650 25.999 28.144 30.765 35.510 
43 22.859 24.398 26.785 28.965 31.625 36.436 
44 23.584 25.148 27.575 29.787 32.487 37.363 
45 24.311 25.901 28.366 30.612 33.350 38.291 
















































































n a=0.25 0.10 0.05 0.025 0.01 0.005 
1 1.323 2.706 3.841 5.024 6.635 1.879 
2 2.73 4.605 5.91 1.378 9.210 10.597 
3 4.108 6.251 7.815 9.348 11.345 12.838 
4 5.385 7.779 9.488 11.143 13.27] 14.860 
5 6.626 9.336 11.071 12.833 15.086 16.750 
6 1.841 10.645 12.592 14.449 16.812 18.548 
7 9.037 12.017 14.067 16.013 18.475 20.278 
8 10.219 13.362 15.507 17.535 20.090 21.955 
9 11.389 14.684 16.919 19.023 21.666 23.589 
10 12.549 15.987 18.307 20.483 23.209 25.188 
u 13.701 17.275 19.675 21.920 24.725 26.757 
12 14.845 18.549 21.026 23.337 26.217 28.299 
13 15.984 19.812 22.362 24.736 27.688 29.819 
14 17.17 21.064 23.685 26.119 29.141 31.319 
15 18.245 22.307 24.996 27.488 30.578 32.801 
16 19.369 23.542 26.296 28.845 32.000 34.267 
17 20.489 24.769 27.587 30.191 33.409 35.718 
18 21.605 25.989 28.869 31.526 34.805 37.156 
19 22.718 27.204 30.144 32.852 36.191 38.582 
20 23.828 28.412 31.410 34.170 37.566 39.997 
a 24.935 29.615 32.671 35.479 38.932 41.401 
22 26.039 30.813 33.924 36.781 40.289 42.796 
23 27.141 32.007 35.172 38.076 41.638 44.181 
24 28.241 33.196 36.415 39.364 42.980 45.559 
25 29.339 34.382 37.652 40.646 44.314 46.928 
2% 30.435 35.563 38.885 41.923 45.642 48.290 
27 31.528 36.741 40.113 43.194 46.963 49.645 
28 32.620 37.916 41.337 44.461 48.278 50.993 
29 33.711 39.087 42.557 45.722 49.588 52.336 
30 34.800 40.256 43.773 46.979 50.892 53.672 
31 35.887 41.422 44.985 48.232 52.191 55.003 
32 36.973 42.585 46.194 49.480 53.486 56.328 
3 38.058 43.745 47.400 50.725 54.776 51.648 
34 39.141 44.903 48.602 51.966 56.061 58.964 
35 40.223 46.059 49.802 53.203 57.342 60.275 
36 41.304 41.212 50.998 54.437 58.619 61.581 
37 42.383 48.363 52.192 55.668 59.892 62.883 
38 43.462 49.513 53.384 56.806 61.162 64.181 
39 44.539 50.660 54.572. 58.120 62.428 65.476 
40 45.616 51.805 55.758. 59.342 63.691 66.766 
41 46.692 52.949 56.942 60.561 64.950 68.053 
42 41.766 54.090 58.124 61.777 66.206 69.336 
43 48.840 55.230 59.304 62.990 67.459 70.616 
4 49.913 56.369 60.481 64.201 68.710 71.893 
45 50.985 57.505 61.656 65.410 69.957 73.166 
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